|
8月13日國(guó)際報(bào)道 Google和其它搜索引擎面臨的并非Wikia這一個(gè)新的競(jìng)爭(zhēng)對(duì)手,而是數(shù)以百計(jì)、數(shù)以千計(jì)的競(jìng)爭(zhēng)對(duì)手。 Wikia CEO吉爾表示,Wikia項(xiàng)目研究成果將進(jìn)入開(kāi)放源代碼領(lǐng)域,降低人們開(kāi)發(fā)搜索引擎的成本。新搜索公司無(wú)須投入數(shù)百萬(wàn)美元索引Web,開(kāi)發(fā)建立搜索網(wǎng)頁(yè)需要的軟件,過(guò)濾空網(wǎng)頁(yè)和垃圾網(wǎng)頁(yè),開(kāi)發(fā)計(jì)算排名的算法,它們能夠在互聯(lián)網(wǎng)上免費(fèi)發(fā)現(xiàn)這些產(chǎn)品。 吉爾在接受采訪時(shí)說(shuō),要建立一個(gè)搜索站點(diǎn)仍然需要投入500-1000萬(wàn)美元,我們希望將搜索站點(diǎn)的開(kāi)發(fā)成本降低到500美元。我們沒(méi)有將Google看成是競(jìng)爭(zhēng)對(duì)手,我們的競(jìng)爭(zhēng)對(duì)手是成本。 該項(xiàng)目包含4個(gè)部分:Web的索引、開(kāi)發(fā)搜索引擎軟件;利用算法和人幫助過(guò)濾站點(diǎn);對(duì)結(jié)果進(jìn)行排名。搜索引擎中最昂貴的部分之一是對(duì)Web的索引。企業(yè)需要購(gòu)買服務(wù)器和軟件,對(duì)Web進(jìn)行遍歷。 吉爾說(shuō),新創(chuàng)建的搜索公司用在購(gòu)買服務(wù)器上的成本將高達(dá)100萬(wàn)美元。這不是一個(gè)好主意的原因有二個(gè):每家搜索公司都必須投入數(shù)百萬(wàn)美元重復(fù)做相同的工作,使這些數(shù)據(jù)能夠開(kāi)放地被所有公司使用應(yīng)該是一個(gè)好主意。我們的目標(biāo)是建立供公開(kāi)使用的Web遍歷數(shù)據(jù)。 對(duì)Web進(jìn)行索引是成立一家新搜索公司的主要障礙之一,通過(guò)不斷的對(duì)Web進(jìn)行索引,現(xiàn)有搜索引擎在不斷的提高這一門(mén)檻。搜索引擎通常每周,甚至每天都對(duì)Web進(jìn)行索引?,F(xiàn)在,這一時(shí)間已經(jīng)縮短到了1小時(shí),甚至更短的時(shí)間。對(duì)Web進(jìn)行索引的高成本已經(jīng)成為了一種競(jìng)爭(zhēng)壁壘。 數(shù)據(jù)挖掘研究院(HAMMER_SHI) Wikia認(rèn)為它對(duì)Web進(jìn)行索引的成本幾近于零,因?yàn)樗蠡ヂ?lián)網(wǎng)用戶通過(guò)從Grub下載Web索引軟件幫助完成索引工作,他們將利用計(jì)算機(jī)的空閑時(shí)間對(duì)Web進(jìn)行索引,并將搜索結(jié)果返回給Wikia。目前,已經(jīng)有1000名用戶下載了該軟件,吉爾希望將這一數(shù)字提高到10萬(wàn)以上。 Wikia正在考慮利用開(kāi)放源代碼Lucene搜索引擎軟件。Wikia計(jì)劃在Lucene項(xiàng)目中投入更多資金,確保它能夠更好地運(yùn)行,或開(kāi)發(fā)自己的軟件。 搜索技術(shù)的另一個(gè)關(guān)鍵部分是決定搜索排名,確保用戶發(fā)現(xiàn)所需要內(nèi)容的算法。這種算法是搜索公司的秘密,由于擔(dān)心被黑客和其他人利用而絕不會(huì)公開(kāi)。Wikia決定開(kāi)發(fā)一個(gè)算法,并放在互聯(lián)網(wǎng)上供用戶免費(fèi)下載。用戶也可以對(duì)算法進(jìn)行修改。 Wikia還計(jì)劃讓互聯(lián)網(wǎng)用戶對(duì)網(wǎng)頁(yè)進(jìn)行過(guò)濾,并希望這能夠提供更好的搜索結(jié)果。 在完成后,Wikia搜索引擎可能會(huì)帶來(lái)收入,但這不是該項(xiàng)目的著眼點(diǎn)。 |
|
|