| 
 
 艾倫人工智能研究所首席執(zhí)行官Oren Etzioni 圖片來源:Brett Hartman 使用谷歌學(xué)術(shù)搜索引擎、PubMed醫(yī)學(xué)文獻(xiàn)搜索引擎時(shí),科學(xué)家可能已經(jīng)覺察到,日益增長的科學(xué)文獻(xiàn)資源讓文獻(xiàn)檢索變得越來越煩瑣。11月2日,位于美國華盛頓州西雅圖市的非營利機(jī)構(gòu)艾倫人工智能研究所(AI2)揭開了一個(gè)新搜索引擎的面紗,它可以向用戶提供別具一格的服務(wù):理解論文的內(nèi)容。 “我們在嘗試更深入地瀏覽文件,同時(shí)使瀏覽速度更快、內(nèi)容更簡潔、有用。”AI2首席執(zhí)行官Oren Etzioni說。 這項(xiàng)免費(fèi)產(chǎn)品的名字是Semantic Scholar(意為語義學(xué)者),目前僅限于搜索計(jì)算機(jī)科學(xué)領(lǐng)域的300萬條開放獲取文獻(xiàn)。但AI2團(tuán)隊(duì)計(jì)劃一年內(nèi)把搜索內(nèi)容擴(kuò)展到多個(gè)學(xué)科領(lǐng)域,Etzioni說。他的團(tuán)隊(duì)得到了充沛的資金支持,AI2由微軟共同創(chuàng)始人保羅·艾倫成立并予以資助,從2013年起至今,艾倫已經(jīng)向該所提供了超過2000萬美元的資助。 目前,全球免費(fèi)學(xué)術(shù)搜索引擎寥寥無幾。而谷歌學(xué)術(shù)是其中最大的搜索引擎,據(jù)推測它包含了1億條甚至更多的學(xué)術(shù)文獻(xiàn)資料,但是該系統(tǒng)仍存在問題。“從任何人的衡量標(biāo)準(zhǔn)來看,大量文獻(xiàn)并非都是學(xué)術(shù)文獻(xiàn)?!毕耐拇髮W(xué)信息學(xué)家Péter Jacsó說。 而語義學(xué)者則提供了一些創(chuàng)新性特征,包括從文本中挑選出最重要的關(guān)鍵詞和短語,而且不需要依賴作者或出版商鍵入這些關(guān)鍵詞?!皩?duì)于智能系統(tǒng)來說,做到這一點(diǎn)非常困難?!盓tzioni說。該引擎利用類似的“機(jī)器閱讀”技術(shù)決定哪些文章概述了哪個(gè)話題。 該系統(tǒng)還可以辨別一篇文章引用的哪個(gè)參考資料確實(shí)具有重要參考價(jià)值,而不僅僅只是作為背景或進(jìn)行對(duì)比來引用?!斑@是一個(gè)非常棒的特征?!蔽靼嘌礼R德里一家名叫“專家系統(tǒng)”的軟件公司的搜索引擎專家Jose Manuel Gomez-Perez說。此外,語義學(xué)者還可以從文章中提取數(shù)據(jù)并呈現(xiàn)在搜索結(jié)果中。(魯捷) 《中國科學(xué)報(bào)》 (2015-11-04 第3版 國際) | 
|  |