【eNet特約評(píng)論】中國(guó)谷歌模仿酷訊推出生活搜索,一度吸引了媒體和用戶對(duì)于所謂“垂直搜索”的關(guān)注。有觀者認(rèn)為,在百度、中國(guó)谷歌和雅虎通吃將近九成的網(wǎng)絡(luò)搜索份額之后,搜索市場(chǎng)的遲到者或許可以在“垂直搜索”中分到一杯羹。
然而,由于定義的模糊,垂直搜索在不同人那里指稱著不同的事物,許多搜索行業(yè)的外行,甚至可以向風(fēng)險(xiǎn) 筆者認(rèn)為,除了目前搜索技術(shù)的限制、可以按照信息媒體類型進(jìn)行垂直的劃分之外,其他的垂直搜索不是要么是和搜索本意背道而馳,要么就根本不是搜索。 何謂搜索?搜索就是從海量的互聯(lián)網(wǎng)信息中尋找到自己需要的內(nèi)容,其兩個(gè)特點(diǎn)一是信息海量,二是信息非結(jié)構(gòu)化,即這些信息都以網(wǎng)頁(yè)、語(yǔ)音、圖片等各種離散形式存在,還不是保存在許多 由于圖像、視頻識(shí)別技術(shù)遠(yuǎn)未成熟,音頻的文本化尚未普及(技術(shù)已經(jīng)存在),今天的搜索引擎不得不分為網(wǎng)頁(yè)搜索、視頻搜索、音樂(lè)、圖片搜索等類型。在OpenV等的技術(shù)之下,視頻中的音頻 媒體類型的分類是不得以而為之,而其他按照網(wǎng)頁(yè)內(nèi)容進(jìn)行的搜索分類則是畫蛇添足,純屬添亂。搜索就是要搜幾十億張網(wǎng)頁(yè)的海量信息,如果按照“論壇”、“百科”、“博客”等人為類別把五十億張網(wǎng)頁(yè)分為五類、十類,然后推出五個(gè)、十個(gè)搜索產(chǎn)品、讓用戶點(diǎn)擊五次、十次,則完全是背道而馳、浪費(fèi)用戶時(shí)間的行為。 由此看來(lái),按照內(nèi)容進(jìn)行劃分的所謂“垂直搜索”是一個(gè)非常誤導(dǎo)的概念,降低了搜索 今天,還有一種所謂的“搜索”也被貼上了“垂直搜索”的標(biāo)簽,最典型的是火車票和機(jī)票。在筆者看來(lái),這些業(yè)務(wù)根本就不是搜索,而只是檢索。判斷依據(jù)就是所查詢的信息是不是海量,信息是不是結(jié)構(gòu)化。 火車車次,航班班次(含折扣價(jià))的數(shù)據(jù)是有限的,而且發(fā)生變動(dòng)的頻率也就是一年一兩次,其信息量遠(yuǎn)遠(yuǎn)未到可供“搜索”的地步。從國(guó)內(nèi)網(wǎng)站來(lái)看,提供火車票、機(jī)票搜索的網(wǎng)站不計(jì)其數(shù),其差別不是檢索技術(shù)的高低,而是數(shù)據(jù)庫(kù)更新是不是及時(shí)。 從技術(shù)角度來(lái)看,在獲得權(quán)威數(shù)據(jù)庫(kù)之后, 技術(shù)開發(fā)十分簡(jiǎn)單的本質(zhì)原因,是因?yàn)闄C(jī)票車票這些信息都是結(jié)構(gòu)化的,檢索過(guò)程可以依賴現(xiàn)有技術(shù),而不用自行開發(fā)極度復(fù)雜的HTML文本搜索技術(shù)。 諸如火車票機(jī)票的 綜上所述,在目前這一代的搜索技術(shù)之下,我們暫且按照信息媒體的類型來(lái)對(duì)搜索分類,這種分類談不上所謂的“垂直化”。而許多號(hào)稱“垂直搜索”的服務(wù)其實(shí)是毫無(wú)技術(shù)含量的“檢索”。 需要強(qiáng)調(diào)的是,搜索的目標(biāo)是用復(fù)雜的算法和分布式計(jì)算技術(shù)從海量非結(jié)構(gòu)化信息中找出用戶最想要的東西。遲來(lái)的搜索業(yè)者如果對(duì)于“算法”和“計(jì)算”沒(méi)有自信,就干脆不要把海量信息的分門別類當(dāng)成自己的事業(yè), 【責(zé)任編輯 朱青】 |
|
|