|
本文假設(shè)你已經(jīng)詳細(xì)閱讀過前面五篇,對Zotero有一定基礎(chǔ)了。 Q1. 如何批量抓取PDF文檔,快速了解研究者重點(diǎn)在前面的文章中,你應(yīng)該學(xué)會一個(gè)重要技巧了,就是通過【google學(xué)術(shù)】,根據(jù)作者名字或者論文名字,搜索出論文全文,然后批量保存到Zotero中。 但是,現(xiàn)實(shí)生活中,還常常存在另一類需求。就是作者很慷慨地提供了自己所有論文的PDF文檔,列在個(gè)人網(wǎng)站上,以備同行引用。 因?yàn)樽髡咦约禾峁┑奈臋n往往清晰度更高、比【Google學(xué)術(shù)】中根據(jù)作者名字搜出來的更齊全一些。怎么批量下載,然后導(dǎo)入到Zotero中?讓我們來舉個(gè)例子。 APA今年的獎(jiǎng)評剛出來了。每年這些獎(jiǎng)項(xiàng)里面,【早期職業(yè)生涯貢獻(xiàn)獎(jiǎng)】 與 【杰出貢獻(xiàn)獎(jiǎng)】 參考價(jià)值不錯(cuò),一個(gè)代表心理學(xué)未來,獲獎(jiǎng)?wù)撸篽ttp:///8kxCp3n 一個(gè)代表心理學(xué)過去,獲獎(jiǎng)?wù)撸篽ttp:///8kxCp3E 其中,Linda B. Smith很猛,近兩年雙豐收。才拿2013年側(cè)重認(rèn)知科學(xué)基礎(chǔ)卓越貢獻(xiàn)獎(jiǎng)的David E. Rumelhart獎(jiǎng)(現(xiàn)在火爆的深度學(xué)習(xí)大牛Hinton是第一個(gè)拿這個(gè)獎(jiǎng)的),今年又拿 【杰出貢獻(xiàn)獎(jiǎng)】 。她的個(gè)人主頁:http:///8kxphwG 我們就以她的論文為例。 步驟如下: 1、安裝一個(gè)chrome的批量下載插件: Chrome Web Store - DownloadAll 2、訪問Linda B. Smith提供出版物的網(wǎng)頁,她恰巧在自己的個(gè)人網(wǎng)站上,提供了PDF全文列表,網(wǎng)址如下: Cognitive Development Lab - Indiana University. Bloomington 點(diǎn)擊該插件,如下圖所示:
選擇后綴為pdf,開始下載。如下圖所示:
牛人發(fā)的論文就是多,一百多篇,咱們可以去喝杯咖啡,讓它慢慢下載,如下圖所示:
3、打開Zotero,新建一個(gè)目錄,用于導(dǎo)入這些pdf,比如,我們建個(gè)目錄,叫做:Linda B. Smith。
4、然后將下載的pdf文件,全部拖入到Linda B. Smith這個(gè)目錄即可。如果你實(shí)在不知道怎么拖,就這么來,找到:【鏈接文件副本。。?!浚缓蟀醋hift鍵,選中所有下載的pdf文件。如下圖所示:
如果PDF文件太多,電腦內(nèi)存較少,請注意別死機(jī),可以考慮分批鏈接。 5、接下來,我們根據(jù)下載的PDF,批量生成文獻(xiàn)信息,如下圖所示,選中所有PDF文件,右鍵:
有些沒找到文獻(xiàn)信息的PDF,要么是年代過早,要么是版本保護(hù)問題,咱們先不管它。也請?zhí)貏e注意,一次別更新太多文獻(xiàn)信息,【Google學(xué)術(shù)】目前有同一時(shí)間請求數(shù)量限制,50篇以內(nèi)最好,超過后請稍候片刻。
6、最后,看一下所有論文的【google學(xué)術(shù)引用次數(shù)】,按照【其它】字段排序。這樣,我們就可以知道Linda B. Smith的核心論文是哪幾篇了。
Q2. 如何建立自己的個(gè)性化知識庫今天,受我鼓吹,開始用Zotero的幾位朋友,都在問我同一個(gè)問題:為什么不能保存國內(nèi)某某網(wǎng)站、某某網(wǎng)站呢? 答:這是設(shè)計(jì)哲學(xué)的不同,它只默認(rèn)抓取高質(zhì)量信息,如google學(xué)術(shù)、science、經(jīng)濟(jì)學(xué)人、華爾街日報(bào)這些。 國內(nèi)那些信息質(zhì)量差的網(wǎng)站,不看也罷。 這是Zotero已支持的信息來源:http:///zTqrKc3 你可以自定義更多信息來源,或拍個(gè)網(wǎng)頁快照來保存。如下圖所示:
自定義信息類型與網(wǎng)頁快照的區(qū)別是,網(wǎng)頁快照不區(qū)分網(wǎng)頁來源,也不進(jìn)行個(gè)性化處理。無論來自什么網(wǎng)站,都統(tǒng)一是拍個(gè)快照。自定義信息類型,則可以進(jìn)行更多精細(xì)加工處理。比如,將Zotero知識庫列出什么菜譜、TED視頻、問答。未來,你可以基于這個(gè)自定義信息類型,去進(jìn)行更多的操作。你可以將它理解為一種對網(wǎng)上半結(jié)構(gòu)化信息進(jìn)行處理的手段。 在Zotero中,這個(gè)自定義信息類型,一般叫做:translators。有以下四種:
第一種是最常用的。我們可以借助于Web translators,定義自己的TED視頻庫、菜譜庫。。。只要你想得到,都可以處理。第一次定義成功后,未來,你再次訪問時(shí),直接網(wǎng)頁收藏即可。 那么,如何自定義信息庫呢?自定義Zotero抓取信息類型非常容易,無需太多編程知識,只需對github與js有點(diǎn)基礎(chǔ)就可以了。 Zotero也提供了一個(gè)插件,參見該插件:http:///8k6CVsb 與該文檔:[dev:translators [Zotero Documentation](http://www./support/dev/translators) 小結(jié)本文介紹了兩個(gè)Zotero實(shí)用技巧。一個(gè)是當(dāng)研究者提供了所有出版物時(shí),如何批量下載,以及根據(jù)批量下載后的PDF生成文獻(xiàn)引用信息,繼而根據(jù)【google學(xué)術(shù)引用次數(shù)】找出她最重要的論文;一個(gè)是,如何保存任意網(wǎng)頁,并根據(jù)自己個(gè)性化需求,開發(fā)自定義的translators,從而打造一個(gè)個(gè)性化的知識庫。 |
|
|