學術堂首頁 | 文獻求助論文范文 | 論文題目 | 參考文獻 | 開題報告 | 論文格式 | 摘要提綱 | 論文致謝 | 論文查重 | 論文答辯 | 論文發表 | 期刊雜志 | 論文寫作 | 論文PPT
學術堂專業論文學習平臺您當前的位置:學術堂 > 圖書檔案學論文 > 搜索引擎論文

學術搜索引擎和資源發現系統的對比分析

時間:2019-10-08 來源:新世紀圖書館 作者:李慧芳 本文字數:6393字

  摘    要: 比較資源發現系統和學術搜索引擎的功能異同,有助于優化圖書館發現服務。本文選取EDS和百度學術搜索為研究對象,通過文獻述評與實驗方法,從資源收錄范圍、數據來源與組織方式、檢索功能、檢索結果運用以及個性化服務等方面比較了兩者異同。結果顯示,在具體的功能上,兩個系統各有優點。最后,本文從資源整合、信息素養教育、知識發現服務三個方面提出圖書館發現服務優化建議。

  關鍵詞: 發現服務; 資源發現系統; 學術搜索; 圖書館;

  Abstract: Comparing the functional similarities and differences between the resource discovery system and academic search engine willoptimize the library discovery service. EDS and Baidu Academic Search are selected as research objects in this paper. Through literature review and experimental methods, this paper compares them from the view of resource types, data source and organization mode, search function, search result application and personalized service.The results show that the two systems have their own advantages in specific functions. Finally, it puts forward optimization suggestions for library discovery service from three aspects: resource integration, information literacy education and knowledge discovery service.

  Keyword: Discovery service; Resource discovery system; Academic search; Library;

  0 、引言

  近年來,幾大搜索引擎公司為進一步方便學術用戶獲取學術資源,紛紛在其原有搜索引擎的基礎上推出了學術搜索引擎。學術搜索引擎通過科學組織、管理和維護網絡中的學術信息,使用戶通過一個檢索入口快速獲取網絡學術信息[1]。目前,該類型的搜索引擎主要有Google Scholar、Microsoft Academic Search以及百度學術搜索。同時,隨著Google Scholar學術搜索的榜樣效應,元數據索引服務開始進入圖書館界的視野,基于元數據倉儲的資源發現系統面世,并在國內外圖書館中得到迅速而廣泛的應用。資源發現系統是通過抽取、映射、收割、導入等手段對海量的來自異構資源的元數據和部分對象數據進行預收集,并通過歸并映射到一個標準的表達式進行預聚合,形成統一的元數據索引,通過單一但功能強大的搜索引擎向終端用戶提供基于本地分布或者遠程中心平臺的統一檢索和服務的系統[2]。資源發現系統自2009年面世以后,發展很快,其中在國內被廣泛應用的系統主要有ProQuest公司的Summon和Primo Central、EBSCO公司的EBSCO Discovery Service(EDS)以及超星發現系統。

  目前,國內學者對學術搜索引擎以及資源發現系統分別做了大量的研究,也有少量的研究是分析比較了這兩類系統的性能、特點,為用戶選擇和使用提供指導,為圖書館引進資源發現系統提供參考,但都沒有涉及面對學術搜索的競爭,圖書館的發現服務該如何應對[3,4,5,6]。本文從資源收錄范圍、數據來源與組織方式、檢索功能、檢索結果以及個性化服務等方面比較這兩類系統的異同,明確各系統的特點,并根據比較結果對圖書館的發現服務提出優化建議。

  1、 研究對象與方法

  1.1、 研究對象

  本文以EDS與百度學術搜索為研究對象。EDS是EBSCO公司2010年推出的網絡級資源發現系統,利用EDS,讀者只需使用單一檢索框,即可在幾秒鐘之內檢索到圖書館的各種電子和紙本館藏,檢索結果與本館館藏資源保持一致。百度學術搜索是百度旗下的學術資源搜索平臺,提供海量中英文文獻檢索,涵蓋了各類學術期刊、會議論文等資源,受到了教育和科研機構用戶的廣泛關注,成為科研工作者獲取文獻的利器。
 

學術搜索引擎和資源發現系統的對比分析
 

  1.2、 研究方法

  本文采用的研究方法主要有兩種:一是文獻調查方法,通過收集與資源發現系統相關的期刊論文、會議報告、產品說明書等,了解資源發現系統的評價指標,尤其是EDS和百度學術的發展歷程與產品性能特征;二是實驗方法,通過具體檢索詞的測試與分析,從系統收錄的學術資源、檢索性能、檢索結果處理以及個性化功能等方面進行比較分析。

  2、 比較結果分析

  2.1、 學術資源

  (1)收錄范圍。EDS的收錄范圍相對明確,根據EBSCO公司最新數據,其收錄了近10萬家期刊和圖書出版機構的資源,覆蓋的資源類型豐富,包括圖書、期刊、學位論文、會議論文、報紙、音頻、樂譜等,但其資源以外文為主,在中文資源方面有所欠缺,目前可以索引到的中文期刊僅有重慶維普以及萬方期刊。百度學術并沒有明確資源收錄的范圍,從其具體的使用來看,資源類型少于EDS,僅僅包括期刊、學位論文、會議論文、圖書、專利5種,資源語種包括中文和英文。

  無論是百度學術還是EDS,均不支持空檢索,因此,筆者隨機選擇幾個檢索詞,對檢索結果的中外文數量做了比較,具體結果見表1。由比較結果可看出,對于中文檢索詞,百度學術檢索結果數量優勢明顯,對于英文檢索詞,EDS檢索結果數量則遙遙領先,這也反映了這兩個系統收錄中英文資源的差異。

  表1 檢索實例比較
表1 檢索實例比較

  (2)資源來源。EDS和百度學術的資源來源具體如圖1所示。

  圖1 EDS和百度學術的資源來源
圖1 EDS和百度學術的資源來源

  EDS資源主要來源于數據庫資源、OA資源以及圖書館自建資源。對于數據庫以及OA資源,主要通過和數據庫商及出版社合作的方式獲取;圖書館自建資源主要是指圖書館自建的書目數據庫以及機構知識庫等本地資源,本地資源是EDS知識庫的重要組成部分,主要通過自動收割或人工導入的方式完成對本地資源數據的映射和上載工作。百度學術搜索的資源主要來源于數據庫資源、OA資源以及網上的免費資源。網上免費資源是指來源于百度文庫、豆丁網、愛學術等途徑的資源,這部分資源以非傳統的形式發布,未經過同行評審,因此會在質量和權威性方面存在差異。

  (3)資源組織。EDS的資料團隊會把不同來源的元數據整合在一起,經過一系列規范化的預處理形成EDS格式統一、內容豐富、結構清晰的元數據倉儲。與資源發現系統的原理相似,百度學術搜索將各種分散的數據不分學科都集中到一個資源庫,形成百度學術搜索后臺超大規模元數據索引知識庫。根據百度學術的聲明,此知識庫元數據來源途徑有三種:題錄數據,來自于數據商合作、OAI(Open Archives Initiative)協議收割、搜索引擎收錄;引文數據,來源于OA(Open Access)集成;全文數據,來自于數據商合作、學術網站解析、PDF解析[7]。筆者在實際運用中發現,百度學術部分資源的元數據存在錯誤或不規范的現象,如在資源類型分類中,部分期刊論文、會議論文未能正確標引,在檢索結果中被劃分為其他類型等。筆者將這兩個系統元數據的主要優勢進行總結比較,具體見表2。

  表2 資源組織比較
表2 資源組織比較

  2.2、 檢索性能

  檢索性能的強弱是評價學術搜索引擎的重要指標,會直接影響用戶體驗效果。

  (1)基本檢索。百度學術搜索和EDS均提供基本檢索和高級檢索兩種檢索功能。基本檢索界面,均為一框式檢索,系統根據用戶輸入的關鍵詞進行檢索。不同的是,EDS除了以上功能外,還支持檢索詞的位置限定功能,提供作者和標題兩種位置限定。為進一步測試這兩大檢索系統的功能,筆者選擇檢索詞“大數據”“中國”“temp*”“ols?n”,并對檢索詞“大數據”“中國”使用布爾邏輯檢索詞進行組配,結果發現,百度學術搜索和EDS均支持布爾邏輯檢索。但對于截詞符,EDS支持截詞符“?”“*”檢索,但百度學術搜索卻不支持,關鍵詞中的“*”或者“?”會被忽略掉。具體見表3所示。

  (2)高級檢索。EDS和百度學術搜索的高級檢索功能比較相似,主要有以下兩個方面:一是對檢索詞的限定,如檢索詞出現的位置,多個檢索詞之間的邏輯關系等;二是對檢索結果的篩選,可從作者、出版物、發表時間、語言等方面對檢索結果進行限定。具體比較見表3。相較于百度學術搜索,EDS在每一部分都提供了多而細致的檢索字段,選項更加豐富。

  (3)輔助檢索功能。百度學術搜索和EDS均支持檢索詞自動補全功能、中英文互檢功能(利用一個檢索詞可同時獲取中文和英文資源)。除了以上常見輔助檢索功能外,兩個系統還具有其獨特的智能化輔助檢索功能。百度學術搜索提供相似文獻、參考文獻和引證文獻的查看功能,從多個角度為用戶提供相關信息;同時具有檢索詞糾錯功能,對拼寫有誤的檢索詞進行指正、修改。

  EDS的輔助檢索功能主要有刊內檢索功能和相關主題擴展檢索。當檢索詞和刊名一致時,EDS將期刊作為第一條檢索結果呈現,并提供檢索框,用戶可輸入檢索詞,在此刊內檢索,提升檢索結果的相關度。EDS還提供“應用對等科目”功能,可根據用戶輸入的關鍵詞,自動匹配出此關鍵詞的不同表述方式,使檢索結果更加完整。

  表3 檢索性能比較
表3 檢索性能比較

  2.3、 檢索結果

  (1)結果展示。檢索結果頁面展示的信息越詳細,越有利于用戶對資源內容的準確掌握,百度學術搜索和EDS均以列表的形式展示檢索結果,且兩者的檢索結果信息較為相似,都包含了文獻的題名、著者、關鍵詞、出版物、摘要、出版日期等主要信息。具體比較見表4。“被引量”是百度學術搜索免費提供的增值功能,不僅可以免費搜索跟蹤期刊文獻的引證文獻,還能搜索跟蹤會議錄、學位論文以及圖書、專利的引證文獻。EDS檢索結果頁面信息提供4種格式供用戶選擇:標準格式、僅限標題格式、簡介格式和詳細格式。選擇的格式不同,檢索結果頁展示的信息詳細程度也不同,本文以標準格式為例。“館藏信息”是針對本館書目信息資源獨有的內容,可以查看該資源的館藏地、流通狀態等信息。“使用量”是與PlumX整合后具有的功能,查看檢索結果被使用情況。

  (2)結果排序。百度學術搜索和EDS默認狀態下均是按相關性對檢索結果進行排序,最相關的文獻排在最上方。時間的排序可幫助用戶篩選出最新和最早的研究。按被引量排序依據了文獻的影響力,引用量越高的資源排序越靠前。

  (3)分面精煉。分面是指事物的多維度屬性,分面精煉是指通過事物的這些屬性不斷篩選、過濾檢索結果的方法[8]。百度學術搜索和EDS提供多個分面,包括內容類型、主題、著者、出版時間、語言等等。利用這些分面,讀者能夠從不同的角度對檢索結果進行歸類整合、層層細化。這兩個系統具體的分面比較見表4。通過比較發現,兩個系統在具體的分面項設置上存在較大差別。對于文獻類型分面,百度學術搜索僅能提供10個二級分面選項,而EDS提供的文獻類型有20多個,且百度學術搜索只能從系統提供的期刊、學位論文、會議論文、專利等選項中選擇一項,但EDS卻可以選擇多項;在出版時間這一分面項上,百度學術搜索可精確到年,而EDS可精確到月。

  (4)全文獲取。EDS和百度學術都提供數據庫的全文下載鏈接,如萬方、Elsevier等,但這一功能的前提下實現的學校已經購買了這些數據庫,具有全文訪問權限,且在學校IP地址范圍內訪問;對于免費資源,則訪問不受限制,如百度學術可提供百度文庫、道客巴巴、豆丁網、愛學術等免費網絡資源的獲取途徑,EDS也支持OA資源的不受限訪問。

  (5)引文輸出。EDS和百度學術搜索均提供多種引文格式供用戶選擇,也均支持以單條或批量的形式直接導入到文獻管理軟件中。具體見表4。

  表4 檢索結果比較
表4 檢索結果比較

  2.4 輔助功能

  (1)個性化功能。學術搜索平臺可以通過獲取并分析用戶的偏好、背景以及信息行為模式,提供充分滿足用戶信息需求的個性化信息服務,使資源發揮出更大功效[9]。百度學術搜索的個性化服務主要包括我的學術、訂閱搜索等功能。“我的學術”可以看作是百度為用戶創建的一個“虛擬學術空間”[10],它主要包括“我的主頁”“我的收藏”和“我的訂閱”三種功能。“我的主頁”是指用戶的個人學術信息,主要是管理自己發表的文獻。“我的收藏”是面向歷史數據的,用戶可以像在電腦上建立文件夾一樣,分類管理收藏的文獻。“我的訂閱”是面向未來數據的,類似RSS閱讀器。用戶完成檢索之后,可以點擊網頁上面的“訂閱該搜索”,隨時跟蹤相關研究的前沿動態。

  EDS對圖書館是完全開放的,允許圖書館定制用戶界面,包括名稱、語言、LOGO、文字說明、顏色以及文獻輸出格式等,同時也允許個人用戶創建EBSCO賬戶,管理文件夾,此文件夾可用于管理文獻、保存檢索歷史、創建電子郵件快訊以及RSS源等。另外,此文件夾可與其他人共享,允許他人查看,自己也可以查看別人的文件夾,方便學術的合作交流。

  (2)系統可擴展性。百度學術搜索不能被集成進虛擬數字圖書館環境中,圖書館可以在其系統中提供百度學術搜索服務,但當用戶點擊百度學術搜索鏈接時,會跳轉到與圖書館無關的百度學術搜索的站點上。而EDS發現系統可以很好地集成圖書館系統,圖書館不但可以按照本館的要求靈活定制EDS的用戶界面,而且能夠實現EDS系統和本館的機構門戶等的無縫集成。

  3、 結論與建議

  3.1、 主要結論

  EDS和百度學術搜索都具有學術資源的發現功能,能夠幫助用戶在海量的信息資源中發現知識。兩個系統工作原理基本一致,但在具體的功能上還存在差別,優劣并存。

  EDS服務對象主要是EDS成員館的用戶,幫助用戶發現本機構擁有的資源。其收錄的資源內容明確,且均為通過正規渠道出版的資源,在學術性和權威性方面要優于百度學術搜索,但其在中文資源的覆蓋面上還非常欠缺。在資源組織上,EDS的元數據在規范性、完整性、穩定性等各方面較百度學術都具有無法比擬的優勢。在檢索性能方面,EDS提供了非常詳盡的檢索選項,整體上優于百度學術搜索,但在本地化方面,還有待加強,如還不支持核心期刊數據以及國內期刊常用的GB/T 7714引文格式。

  百度學術是免費搜索工具,傾向于公網文獻的獲取,資源來源廣泛,既有數據庫資源,又有網絡免費資源,尤其在中文資源上具有得天獨厚的優勢,但其資源類型較少,且元數據的質量呈現良莠不齊狀態,這直接限制了百度學術檢索和分面功能。但其檢索詞糾錯功能、核心期刊的篩選功能、引文的GB/T7714格式以及“被引次數”查看功能符合國內用戶的需求和使用習慣,極大提升了用戶的使用體驗。

  3.2、 實踐建議

  (1)學術資源整合方面。首先是加強中文資源的收錄,對中文資源收錄的缺失,是國外資源發現系統的一大軟肋,應盡快與國內數據庫商合作。其次是增加網絡免費資源的收錄。圖書館發現系統應在做好這些資源的學術性、穩定性評估的前提下,提供網絡免費資源檢索服務。

  (2)信息素養教育方面,應注重提升學生整體信息素養。信息素養教育內容應在原有的檢索及處理技能的基礎上,更多地轉向對信息資源的評估、分析和共享方面,培養學生判斷信息的權威性、可靠性、真實性的能力,使學生能自覺運用批判性思維及時修正、調整認知過程。同時,圖書館應教會學生利用社交技術建立個人學習網絡,與學習網絡密切相關的標簽、隱私等相關問題都應成為當前信息素養教育的主要內容。在教育方式上,以資源發現系統為平臺,開展信息搜索、信息評估乃至英文閱讀等教學。

  (3)知識發現服務方面,應向著個性化和精準化方向發展。發現服務系統將圖書館海量的數據整合為一體,為圖書館更深層次地挖掘知識提供了數據基礎。圖書館應注重收集用戶的訪問數據,挖掘分析用戶行為特征,構建圖書館用戶畫像信息,將發現系統與用戶畫像相結合,為用戶提供個性化知識發現服務。

  參考文獻

  [1]劉敏.中英文學術搜索引擎的對比研究[J].圖書館學研究, 2014(24):29-35.
  [2]聶華,朱玲.網絡級發現服務:通向深度整合與便捷獲取的路徑[J].大學圖書館學報, 2011(6):5-10.
  [3]崔明,王振妘.百度學術搜索和Summon學術發現的比較研究[J].圖書館雜志, 2018(4):74-80.
  [4]蘇建華.圖書館選擇資源發現系統的策略分析:以資源發現系統與學術搜索引擎的比較為視角[J].情報科學, 2015(6):91-94,105.
  [5]許新巧,劉華,詹華清.學術搜索引擎Primo和Google Scholar的比較分析[J].圖書館學研究,2013(18):38-43.
  [6]覃燕梅.百度學術搜索與超星發現系統比較分析及評價[J].現代情報,2016(3):48-52.
  [7]王新才,謝宇君.知識發現系統與通用學術搜索引擎文獻資源比較研究:以超星發現和百度學術為例[J].福建論壇(人文社會科學版),2018(4):166-174.
  [8]耿海英,肖仙桃.Web of Science和Google Scholar引文襝索功能比較[J].圖書與情報,2007(3):100-102.
  [9]廖鳳.國內外文獻數據庫個性化服務研究[J].圖書情報工作,2010(13):67-70.
  [10]魏瑞斌,郭一嫻.基于用戶體驗的百度學術應用研究[J].現代情報,2017(5):91-99.

    李慧芳.資源發現系統與學術搜索引擎功能比較研究——以EDS和百度學術搜索為例[J].新世紀圖書館,2019(09):76-80.
    相近分類:
    • 成都網絡警察報警平臺
    • 公共信息安全網絡監察
    • 經營性網站備案信息
    • 不良信息舉報中心
    • 中國文明網傳播文明
    • 學術堂_誠信網站
    快乐赛车开奖直播