這也是個(gè)談濫了的題目。
然而感覺(jué)有必要整理、匯總一下。
促使感到有必要整理一下的原因見(jiàn)文末。
Taxonomy沒(méi)有必要多談,屬于“圈子里”的小眾學(xué)問(wèn),有大量的成熟研究。圖書(shū)館學(xué)家們很有話語(yǔ)權(quán)。
Ontology計(jì)算機(jī)專(zhuān)家正在搞,特別是語(yǔ)義Web的那些家伙們,歐洲最為瘋狂,目前有數(shù)十億歐元的項(xiàng)目在做。
Folksonomy為什么生命力如此旺盛?讓“專(zhuān)業(yè)人士”頗費(fèi)思量。
網(wǎng)頁(yè)、圖片、書(shū)簽、音樂(lè)/視頻片段乃至其他任何“細(xì)粒度”的信息資源需要標(biāo)識(shí),并用“元數(shù)據(jù)”進(jìn)行描述,是基本需求。
這種細(xì)粒度的資源姑且稱(chēng)為“微資源(micro-resource)”。由于微內(nèi)容(microcontent)已經(jīng)有特殊含義,一般指由某種微格式(microformat)編碼的內(nèi)容,或者最起碼已經(jīng)具有id,能夠獨(dú)立管理的內(nèi)容。
而對(duì)微資源的這種操作需求往往在現(xiàn)在的Web(Web1.0)上沒(méi)有很好的方式或者工具能夠滿足。數(shù)字圖書(shū)館的微觀結(jié)構(gòu)包含作為微資源的數(shù)字對(duì)象,如Kahn/Welinsky結(jié)構(gòu)(handle-metadata-data/link)即是一種微資源結(jié)構(gòu)。Warwick Framework也是。
以下對(duì)微資源的功能需求進(jìn)行簡(jiǎn)單總結(jié):
- 微資源的產(chǎn)生(例如:做網(wǎng)絡(luò)書(shū)簽?);
- 微資源需要標(biāo)識(shí)(permanent id?);
- 微資源需要描述(metadata);
- 微資源需要重組(聚合);
- 微資源的重用;
- 微資源的呈現(xiàn)(tag cloud?);
- 微資源的管理和利用需要工具(flickr/del.icio.us/blinklist/365key…)。
可以看出,我把folksonomy的產(chǎn)生和應(yīng)用與微資源的產(chǎn)生和應(yīng)用是緊緊聯(lián)系在一起的。
那么,從專(zhuān)業(yè)角度考察,folksonomy有哪些發(fā)展方向呢?
考察folksonomy:
- Folksonomy由tag組成。
- Tag在folksonomy中是微資源的指代物。
- 通過(guò)檢出tag而檢出微資源。
- Tag是平面的。
- Tag是隨意的。
- Tag云圖反映了tag的權(quán)重。
Tag的發(fā)展方向(有些目前已經(jīng)有了,但還不完善):
- Tag可以排序(除了目前的字順和權(quán)重,還有多種形式,包括動(dòng)態(tài)形式,如結(jié)合相關(guān)反饋、合作過(guò)濾、點(diǎn)擊次數(shù)、甚至類(lèi)pagerank等);
- Tag可以層級(jí)化(層次關(guān)系,例如del.icio.us目前支持的tag類(lèi)目);
- Tag可以聚類(lèi)(反映了資源之間的關(guān)系;經(jīng)常在一起的tag具有較為密切的關(guān)系,等等);
- Tag可以規(guī)范化(同義詞、反義詞歸并指代;用代屬分參關(guān)系標(biāo)注等)。
這些發(fā)展,與應(yīng)用的成本/邊際效用/方便性有關(guān)。
這些發(fā)展,到了一定程度,就不是folksonomy了。
Folksonomy并非絕對(duì)“自由”,并非沒(méi)有體系,只是做標(biāo)注(tagging)的人沒(méi)有意識(shí)到(自己的體系)而已。
Folksonomy的一個(gè)極端形式是Topic Maps (ISO13250);
Topic Maps可以看成一種Ontology。
Taxonomy是一類(lèi)概念體系分類(lèi)方法的總稱(chēng),不具有嚴(yán)格的規(guī)定。但也可以看成一種不完整的Ontology。
對(duì)應(yīng)于極端自由的Folksonomy,極端規(guī)范的、形式化的概念體系是Ontology。
Tom Gruber說(shuō):
Ontologies are enabling technology for the Semantic Web. They are a means for people to state what they mean by formal terms used in data that they might generate or consume. Folksonomies are an emergent phenomenon of the social web. They are created as people associate terms with content that they generate or consume. Recently the two ideas have been put into opposition, as if they were right and left poles of a political spectrum.
Tom Gruber又說(shuō):其實(shí)半形式化就夠了,就能夠起到很大的作用,Ontology的絕對(duì)形式化是做不到的。(大意如此)
半形式化的Folksonomy能夠?qū)ξ①Y源的語(yǔ)義標(biāo)注(annotation)帶來(lái)革命性的影響。
“半”到什么程度很難說(shuō)。
或許一點(diǎn)點(diǎn)就夠了,就可能起到很大作用。
例如同義詞(一個(gè)詞的不同寫(xiě)法:web2/web20/web2.0/web 2.0)的自動(dòng)后臺(tái)歸并?
要知道A little semantics goes a long way.
根本的:需要工具支持,需要2.0應(yīng)用的支持。
前一陣(《圖書(shū)館雜志》2月號(hào))發(fā)了一篇講taxonomy的,很好。今天審到一篇投稿,講folksonomy的,也很好,leon已經(jīng)跟王主編說(shuō)了,快發(fā)。
這些投稿其實(shí)都沒(méi)有本文看得深,看得透(嘿嘿,文章是自己的好,;-),吹一個(gè))。
然而本文的許多觀點(diǎn)需要實(shí)驗(yàn)佐證。實(shí)驗(yàn)需要語(yǔ)料,需要樣本,需要系統(tǒng),需要代碼、需要比較數(shù)據(jù)。
圖書(shū)館學(xué)屬于人文科學(xué),可以拍腦袋,因而不需要。
而計(jì)算機(jī)科學(xué)的論文需要。
這就是科學(xué)和學(xué)科的差別。




