|
PDF是電子圖書常用的文件格式,但是由于PDF文件不便閱讀(需要安裝Acrobat才能看),而且少則幾百K,多則十來兆,不便網(wǎng)上傳輸,我們常常希望能把它轉(zhuǎn)化成文本文件格式,卻又往往無從下手。其實(shí),這并不是一件難事。 本文來自:博研聯(lián)盟論壇
首先,我要向大家介紹一個能將PDF文件轉(zhuǎn)成TXT文件的軟件——Aerial2.0。(not compatible with Acrobat 5). 本文來自:博研聯(lián)盟論壇 我們知道,閱讀PDF文件的工具,當(dāng)屬Adobe的Acrobat reader軟件了,而Aerial則是Acrobat的一個插件。在安裝了Aerial之后,Acrobat reader的菜單中的"plug-ins"就會多出一項(xiàng)"Aerial"。 本文來自:博研聯(lián)盟論壇 Aerial 2.0為我們?yōu)g覽PDF文件提供了強(qiáng)大的功能: 本文來自:博研聯(lián)盟論壇 1.index manager:用于查找和管理文章的索引(必須要有Acrobat Exchange); 本文來自:博研聯(lián)盟論壇 2.navigator: 為PDF文件建立樹結(jié)構(gòu),方便我們?yōu)g覽; 本文來自:博研聯(lián)盟論壇 3.paper clip page:剪貼頁管理(必須要有Acrobat Exchange); 本文來自:博研聯(lián)盟論壇 4.copy table to clipboard:將表格復(fù)制到剪貼板; 本文來自:博研聯(lián)盟論壇 5.save as RTF :這才是我們最需要的功能,轉(zhuǎn)化之后不僅保留了文字,連字體和顏色圖案都能保留下來! 本文來自:博研聯(lián)盟論壇 但是,Aerial并不是萬能的,它對中文支持不太好,排版有時會比較混亂,而且遇上掃描的純圖形的PDF文件時就無能為力了。要想把此類PDF文件轉(zhuǎn)化成文本文件,就相對麻煩一些了,具體步驟如下: 本文來自:博研聯(lián)盟論壇 1.先用Acrobat打開PDF文件,選定區(qū)域,放大到300%500%(視具體情況而定), 復(fù)制到剪貼板。 本文來自:博研聯(lián)盟論壇 2.用Photoshop或Photoimpact等圖形軟件調(diào)出剪貼板的圖形,存成單色的(注意:一定要單色)TIF、PCX或BMP文件,圖形文件格式視你所用的OCR軟件而定。筆者推薦使用BMP文件存盤。 本文來自:博研聯(lián)盟論壇 3.用OCR軟件識別圖形文件(筆者用的是Wtocr7.0),經(jīng)過簡單的排版校正后,一般能有95%以上的識別率。再經(jīng)過你的手工修改后,就可以了。 本文來自:博研聯(lián)盟論壇 以上是筆者在實(shí)際過程中的一些經(jīng)驗(yàn),希望能對朋友們有所啟發(fā)。Aerial 可以到http://www./soft/28-1.asp下載?;蛘唿c(diǎn)此下載。 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 想把PDF文件轉(zhuǎn)換成文本方式的工具也很多。比如在Acrobat 5.0中,我們可以快速地將Adobe PDF文件另存為RTF文件,或者TIFF、JPEG、PNG格式的圖像文件。Acrobat可將Adobe PDF文件的每個頁面轉(zhuǎn)換成單個的圖像文件,圖像格式視所選而定;利用PDF2HTM也可以將PDF文件變?yōu)镠TML文件,而且完全支持中英文PDF文檔的轉(zhuǎn)換,對PDF的版面信息可以完全保留,生成HTML的效果基本與原版的PDF一致,簡單排版后即可輸出。如果你對其中的插圖不感興趣,還可以用PDF2TXT。下面我們一起來看看下PDF2HTM和PDF2TXT的用法。 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 ★PDF2HTM★ 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 從http://www./pdf_ps/pdf2htm/PDF2HTM2.0.zip處下載的PDF2HTM文件不過106KB,其中包括一個文本文件README.TXT和一個程序文件PDF2HTM.EXE。這是一個基于DOS環(huán)境的程序文件,由魔鏡軟件工作室獨(dú)立開發(fā)。 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 它的用法很簡單。進(jìn)入MSDOS方式,轉(zhuǎn)到程序所在目錄,假設(shè)要轉(zhuǎn)換的PDF文件也在同一目錄,文件名為demo.pdf,在DOS命令提示符下輸入“PDF2HTM demo.pdf”即可。再dir一下或者回到Windows資源管理器下看看,增加了些什么文件? 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 ★PDF2TXT★ 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 從ftp://ftp1.mydown.com/home2/soft33/pdf2txtv2.0.zip處下載的pdf2txtv2.0.zip是508KB,內(nèi)含兩個文件:GZIP.dll和pdf2txt.exe。我們只需把它們解壓到同一目錄即可。 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 運(yùn)行pdf2txt.exe,單擊“File”下的“PDF2TXT”,彈出打開文件對話框,如圖1。選擇一個欲轉(zhuǎn)換的PDF文件,單擊“打開”,隨后彈出一“另存為”對話框,設(shè)定文本文件保存的位置。單擊“保存”。OK!快到你所設(shè)定的位置上去看看吧。是不是很令人心動? 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 當(dāng)然,如果你已經(jīng)安裝了Adobe Acrobat Reader,你就可以用它來轉(zhuǎn)換PDF文件了。 本文來自:博研聯(lián)盟論壇 本文來自:博研聯(lián)盟論壇 以上給大家詳細(xì)介紹了獲取各種幫助文檔的源文件(文本文件和其中的插圖)的工具和用法。利用這些源文件,我們就可以實(shí)現(xiàn)本篇開頭所提出來的目標(biāo)——既不買書,又可以免去了眼睛的“奔波勞頓”(看屏幕要左右來回移動)之苦。把幫助文檔的源文件用打印機(jī)打出來,自己制作的一本參考書不就到手了嗎? |
|
|