Zotero（6）：如何批量下載PDF

看見就非常 2020-01-30

展開全文

本文假設(shè)你已經(jīng)詳細(xì)閱讀過前面五篇，對Zotero有一定基礎(chǔ)了。

Q1. 如何批量抓取PDF文檔，快速了解研究者重點(diǎn)

在前面的文章中，你應(yīng)該學(xué)會一個(gè)重要技巧了，就是通過【google學(xué)術(shù)】，根據(jù)作者名字或者論文名字，搜索出論文全文，然后批量保存到Zotero中。

但是，現(xiàn)實(shí)生活中，還常常存在另一類需求。就是作者很慷慨地提供了自己所有論文的PDF文檔，列在個(gè)人網(wǎng)站上，以備同行引用。

因?yàn)樽髡咦约禾峁┑奈臋n往往清晰度更高、比【Google學(xué)術(shù)】中根據(jù)作者名字搜出來的更齊全一些。怎么批量下載，然后導(dǎo)入到Zotero中？讓我們來舉個(gè)例子。

APA今年的獎(jiǎng)評剛出來了。每年這些獎(jiǎng)項(xiàng)里面，【早期職業(yè)生涯貢獻(xiàn)獎(jiǎng)】與【杰出貢獻(xiàn)獎(jiǎng)】參考價(jià)值不錯(cuò)，一個(gè)代表心理學(xué)未來，獲獎(jiǎng)?wù)撸篽ttp:///8kxCp3n 一個(gè)代表心理學(xué)過去，獲獎(jiǎng)?wù)撸篽ttp:///8kxCp3E

其中，Linda B. Smith很猛，近兩年雙豐收。才拿2013年側(cè)重認(rèn)知科學(xué)基礎(chǔ)卓越貢獻(xiàn)獎(jiǎng)的David E. Rumelhart獎(jiǎng)（現(xiàn)在火爆的深度學(xué)習(xí)大牛Hinton是第一個(gè)拿這個(gè)獎(jiǎng)的），今年又拿【杰出貢獻(xiàn)獎(jiǎng)】。她的個(gè)人主頁：http:///8kxphwG

我們就以她的論文為例。

步驟如下：

1、安裝一個(gè)chrome的批量下載插件：

Chrome Web Store - DownloadAll

2、訪問Linda B. Smith提供出版物的網(wǎng)頁，她恰巧在自己的個(gè)人網(wǎng)站上，提供了PDF全文列表，網(wǎng)址如下：

Cognitive Development Lab - Indiana University. Bloomington

點(diǎn)擊該插件，如下圖所示：

Zotero 1

選擇后綴為pdf，開始下載。如下圖所示：

Zotero 2

牛人發(fā)的論文就是多，一百多篇，咱們可以去喝杯咖啡，讓它慢慢下載，如下圖所示：

Zotero 3

3、打開Zotero，新建一個(gè)目錄，用于導(dǎo)入這些pdf，比如，我們建個(gè)目錄，叫做：Linda B. Smith。

Zotero 4

4、然后將下載的pdf文件，全部拖入到Linda B. Smith這個(gè)目錄即可。如果你實(shí)在不知道怎么拖，就這么來，找到：【鏈接文件副本。。?！浚缓蟀醋hift鍵，選中所有下載的pdf文件。如下圖所示：

Zotero 5

如果PDF文件太多，電腦內(nèi)存較少，請注意別死機(jī)，可以考慮分批鏈接。

5、接下來，我們根據(jù)下載的PDF，批量生成文獻(xiàn)信息，如下圖所示，選中所有PDF文件，右鍵：

Zotero 6

有些沒找到文獻(xiàn)信息的PDF，要么是年代過早，要么是版本保護(hù)問題，咱們先不管它。也請?zhí)貏e注意，一次別更新太多文獻(xiàn)信息，【Google學(xué)術(shù)】目前有同一時(shí)間請求數(shù)量限制，50篇以內(nèi)最好，超過后請稍候片刻。

Zotero 7

6、最后，看一下所有論文的【google學(xué)術(shù)引用次數(shù)】，按照【其它】字段排序。這樣，我們就可以知道Linda B. Smith的核心論文是哪幾篇了。

Zotero 8

Q2. 如何建立自己的個(gè)性化知識庫

今天，受我鼓吹，開始用Zotero的幾位朋友，都在問我同一個(gè)問題：為什么不能保存國內(nèi)某某網(wǎng)站、某某網(wǎng)站呢？

答：這是設(shè)計(jì)哲學(xué)的不同，它只默認(rèn)抓取高質(zhì)量信息，如google學(xué)術(shù)、science、經(jīng)濟(jì)學(xué)人、華爾街日報(bào)這些。國內(nèi)那些信息質(zhì)量差的網(wǎng)站，不看也罷。

這是Zotero已支持的信息來源：http:///zTqrKc3

你可以自定義更多信息來源，或拍個(gè)網(wǎng)頁快照來保存。如下圖所示：

Zotero 9

自定義信息類型與網(wǎng)頁快照的區(qū)別是，網(wǎng)頁快照不區(qū)分網(wǎng)頁來源，也不進(jìn)行個(gè)性化處理。無論來自什么網(wǎng)站，都統(tǒng)一是拍個(gè)快照。自定義信息類型，則可以進(jìn)行更多精細(xì)加工處理。比如，將Zotero知識庫列出什么菜譜、TED視頻、問答。未來，你可以基于這個(gè)自定義信息類型，去進(jìn)行更多的操作。你可以將它理解為一種對網(wǎng)上半結(jié)構(gòu)化信息進(jìn)行處理的手段。

在Zotero中，這個(gè)自定義信息類型，一般叫做：translators。有以下四種：

Web translators：比如，抓取豆瓣圖書，將其數(shù)據(jù)類型整理為book。這是一位開發(fā)者寫好的：zotero/translators
Import translators
Export translators
Search translators

第一種是最常用的。我們可以借助于Web translators，定義自己的TED視頻庫、菜譜庫。。。只要你想得到，都可以處理。第一次定義成功后，未來，你再次訪問時(shí)，直接網(wǎng)頁收藏即可。

那么，如何自定義信息庫呢？自定義Zotero抓取信息類型非常容易，無需太多編程知識，只需對github與js有點(diǎn)基礎(chǔ)就可以了。 Zotero也提供了一個(gè)插件，參見該插件：http:///8k6CVsb 與該文檔：[dev:translators [Zotero Documentation］(http://www./support/dev/translators)

小結(jié)

本文介紹了兩個(gè)Zotero實(shí)用技巧。一個(gè)是當(dāng)研究者提供了所有出版物時(shí)，如何批量下載，以及根據(jù)批量下載后的PDF生成文獻(xiàn)引用信息，繼而根據(jù)【google學(xué)術(shù)引用次數(shù)】找出她最重要的論文；一個(gè)是，如何保存任意網(wǎng)頁，并根據(jù)自己個(gè)性化需求，開發(fā)自定義的translators，從而打造一個(gè)個(gè)性化的知識庫。

本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：看見就非常 > 《待分類》

舉報(bào)/認(rèn)領(lǐng)