Nutch
Nutch 是一個(gè)剛剛誕生開(kāi)放源代碼(open-source)的web搜索引擎。在它的主頁(yè)有中文詳細(xì)的說(shuō)明。
http://nutch./docs/zh/about.html
Lucene
|
Apache Lucene是一個(gè)開(kāi)放源程序的搜尋器引擎,利用它可以輕易地為Java軟件加入全文搜尋功能。Lucene的最主要工作是替文件的每一個(gè)字作索引,索引讓搜尋的效率比傳統(tǒng)的逐字比較大大提高,Lucen提供一組解讀,過(guò)濾,分析文件,編排和使用索引的API,它的強(qiáng)大之處除了高效和簡(jiǎn)單外,是最重要的是使使用者可以隨時(shí)應(yīng)自已需要自訂其功能。
|
|
http://jakarta./lucene/docs/index.html
Egothor
|
Egothor是一個(gè)用Java編寫(xiě)的開(kāi)源而高效的全文本搜索引擎。借助Java的跨平臺(tái)特性,Egothor能應(yīng)用于任何環(huán)境的應(yīng)用,既可配置為單獨(dú)的搜索引擎,又能用于你的應(yīng)用作為全文檢索之用。
|
http://www./
Oxyus
BDDBot
|
BDDBot是一個(gè)簡(jiǎn)單的易于理解和使用的搜索引擎。它目前在一個(gè)文本文件(urls.txt)列出的URL中爬行,將結(jié)果保存在一個(gè)數(shù)據(jù)庫(kù)中。它也支持一個(gè)簡(jiǎn)單的Web服務(wù)器,這個(gè)服務(wù)器接受來(lái)自瀏覽器的查詢(xún)并返回響應(yīng)結(jié)果。它可以方便地集成到你的Web站點(diǎn)中。
|
http://www./bddbot/
Zilverline
|
Zilverline是一個(gè)搜索引擎,它通過(guò)web方式搜索本地硬盤(pán)或intranet上的內(nèi)容。Zilverline可以從PDF, Word, Excel, Powerpoint, RTF, txt, java, CHM,zip, rar等文檔中抓取它們的內(nèi)容來(lái)建立摘要和索引。從本地硬盤(pán)或intranet中查找到的結(jié)果可重新再進(jìn)行檢索。Zilverline支持多種語(yǔ)言其中包括中文。
|
http://www./zilverlineweb/space/home |
XQEngine
|
XQEngine用于XML文檔的全文本搜索引擎.利用XQuery做為它的前端查詢(xún)語(yǔ)言.它能夠讓你查詢(xún)XML文檔集合通過(guò)使用關(guān)鍵字的邏輯組合.有點(diǎn)類(lèi)似于Google與其它搜索引擎搜索HTML文檔一樣.XQEngine只是一個(gè)用Java開(kāi)發(fā)的很緊湊的可嵌入的組件.
|
|
http://xqengine./
|
|
|
|