小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

本體的建立及本體庫的標(biāo)注問題

 照壁山人 2010-04-25
在本體的建模階段,大部分的建模工作都集中在領(lǐng)域知識的抽象表示上,即發(fā)現(xiàn)領(lǐng)域內(nèi)的概念、概念的繼承層次、潛在的關(guān)系和公理等。對于領(lǐng)域中的實例,在建模時一般不需要考慮它們,除非建模時就能確定該本體所涉及的所有實例。實際上,通常的本體都具有一定的通用性,表示特定領(lǐng)域內(nèi)的知識,但由于領(lǐng)域內(nèi)可能的實例數(shù)目無窮無盡且動態(tài)變化,因此,只有本體和一個具體的應(yīng)用結(jié)合時考慮實例才有意義。將現(xiàn)實應(yīng)用中涉及的實例和抽象的本體概念相聯(lián)系,這正是語義標(biāo)注(Semantic Annotation)所要做的工作。和數(shù)據(jù)庫類比,語義標(biāo)注就如同為建立好的數(shù)據(jù)庫表添加具體的紀(jì)錄。

          從語義Web的角度來看,在傳統(tǒng)Web上添加語義信息,將Web的狀態(tài)從機(jī)器可讀提高到機(jī)器可理解,這是整個語義Web實現(xiàn)的基礎(chǔ)。通常,這種語義信息的添加是基于本體進(jìn)行的,稱之為語義標(biāo)注。語義標(biāo)注將推動語義Web走向?qū)嶋H應(yīng)用,智能Agent能夠根據(jù)Web上的語義信息實現(xiàn)智能推理任務(wù),并能提高信息檢索的精確性。

          如果將本體看作簡化了的知識庫,那么從本體的角度來看,添加實例,即進(jìn)行語義標(biāo)注,可視為豐富本體的過程。如果站在語義Web的角度來看,語義標(biāo)注便是語義信息的發(fā)布過程:用戶依據(jù)一定的本體,為頁面添加語義信息。然而,語義Web中的標(biāo)注問題由于受到多方面因素的影響,變得很復(fù)雜。一部分人希望語義Web上的語義信息能像頁面本身的創(chuàng)建一樣,由用戶來完成,因為任何機(jī)構(gòu)都不可能完成如此龐大的語義標(biāo)注任務(wù)。這樣一來,任何用戶都能夠選擇或創(chuàng)建自己喜好的本體,并利用它們來標(biāo)注頁面。這些本體的規(guī)模通常是小型的。目前的很多研究者都支持這種觀點,它們認(rèn)為語義Web將建立在無數(shù)的小本體之上,正如Rousset在ISWC2004大會上的特邀演講中所說的:“Small can be beautiful in the Semantic Web”[Rou04]。但這種觀點的缺點也很明顯:大量的小本體往往是異構(gòu)的,這將造成在使用語義信息的過程中需要頻繁執(zhí)行處理本體異構(gòu)的操作,給應(yīng)用系統(tǒng)帶來沉重的負(fù)擔(dān)。為了克服第一種觀點的缺陷,一部分人希望某些大型的機(jī)構(gòu)能提供一些權(quán)威而通用的大本體,讓用戶在標(biāo)注的過程中使用。但這樣做也同樣會導(dǎo)致很多問題:首先,本體的提供者如果被少數(shù)機(jī)構(gòu)壟斷,那將大大限制了用戶表達(dá)自己思想的自由,Web從此失去了它與生俱來的自由本質(zhì);其次,目前的研究已經(jīng)表明,創(chuàng)建涵蓋人類多個方面知識的大規(guī)模本體極其困難,而又要讓這樣的本體得到Web用戶的公認(rèn),這個目標(biāo)更難以達(dá)到;最后,也是最重要的問題是:什么機(jī)構(gòu)或組織能提供這樣的本體呢?W3C還是ISO?Google還是Yahoo?美國國家標(biāo)準(zhǔn)局還是中國國家標(biāo)準(zhǔn)局?這種本體的標(biāo)準(zhǔn)之爭必然會涉及到不同國度、歷史背景和文化,很難有一個最終的結(jié)果。在我們看來,上述兩種觀點都過于極端,切實可行的標(biāo)注方案應(yīng)該是二者的折中,既要保證標(biāo)注的本體具有一定的通用性,又要保證它能滿足用戶的要求。涉及專業(yè)領(lǐng)域的本體可由領(lǐng)域中的權(quán)威機(jī)構(gòu)統(tǒng)一制定,如醫(yī)學(xué)中的UMLS本體,而涉及文化沖突的本體制定時可以考慮多個版本。因此,對語義Web來說,語義標(biāo)注不僅僅是一種技術(shù),更是一種文化。

          語義標(biāo)注技術(shù)也碰到了經(jīng)典的“雞與蛋”的問題:一方面通常的網(wǎng)頁創(chuàng)建者很不愿意為創(chuàng)作的網(wǎng)頁內(nèi)容提供語義標(biāo)注,除非他親自感受到那樣做所帶來的巨大好處;另一方面只有大規(guī)模的語義標(biāo)注數(shù)據(jù)存在,并在Web上實現(xiàn)優(yōu)于現(xiàn)有技術(shù)或現(xiàn)有技術(shù)不能解決的應(yīng)用,才可能有更多人或團(tuán)體愿意提供語義標(biāo)注。最后,在語義標(biāo)注過程中通常既要保證個人的觀點,又要比較權(quán)威的專家的意見,而且還需要大量本體來滿足不同用戶的需求;某些用戶僅希望通過標(biāo)注來更快地找到標(biāo)注對象所對應(yīng)的網(wǎng)站,而那些本身知道鏈接的高層用戶還要求進(jìn)一步獲得關(guān)于標(biāo)注對象的更精確的描述。

          作為語義Web的基礎(chǔ),很多研究機(jī)構(gòu)都對其進(jìn)行了深入的研究,但并沒有取得根本性的進(jìn)展。至今,語義標(biāo)注仍然是語義Web實現(xiàn)的瓶頸問題。

          本觀點: 本體的建立未必需要統(tǒng)一的標(biāo)準(zhǔn),具體應(yīng)該針對具體的應(yīng)用場景;

          就如各種軟件,各種數(shù)據(jù)庫很多內(nèi)容不被共享,很多本體也不是為了通用而建立的。大家有了一個具體的項目,如果使用本體會有比較好的效率,才會去建立這么一個領(lǐng)域?qū)S帽倔w。我發(fā)現(xiàn)國內(nèi)的研究人員存在空空地去建立一個本體,然后為這個本體去尋找一個用途,基本上是本末倒置了。所以才會出現(xiàn)樓上朋友的問題。

          本體的建立,本來大家就各建各的。就如中國人看中文網(wǎng)頁,美國人看英文網(wǎng)頁道理一樣,沒有必要做到統(tǒng)一的標(biāo)準(zhǔn)。也沒有聽說網(wǎng)頁的設(shè)計,軟件的設(shè)計要有嚴(yán)格統(tǒng)一的標(biāo)準(zhǔn)咯。只要有統(tǒng)一的語言和正確的過程,就可以了。

          本體研究很注重規(guī)模效應(yīng),一個學(xué)校幾個人小打小鬧根本不會出好成果。一個實驗室?guī)资藥装偃f的年投入才可能。這種除了國家重點實驗室,國內(nèi)還沒有這個條件。說到底,構(gòu)建本體,本題標(biāo)注等等技術(shù)和理論都不是瓶頸,瓶頸在錢。protege為什么能流行最廣,德國的KAON卻不行,還不是開發(fā)protege的幾所實驗室財力雄厚?

          本觀點:涉及本體的多語言實現(xiàn)問題;

          本體建立應(yīng)該說可以分成自頂向下和自底向上兩種,兩者各有優(yōu)勢。

          但是似乎目前更多的做法是自頂向下的,就是先建頂層本體,在一步步擴(kuò)展,直到領(lǐng)域應(yīng)用所需要的本體。

          同時我還認(rèn)為本體與語言還不一樣,語言可能有不同的語言的差別,但是本體應(yīng)該是概念的表達(dá),是獨立于語言的更為本質(zhì)的東西。所以在建立本體時對概念應(yīng)該先給它一個URI,然后指出某種語言稱這個概念為“……”。

比如說要表達(dá) 人 這個概念,我們可以先為它制定一個URI“http://www.pp.pp#person”,然后將其屬性“EnglishName”設(shè)為“person”,屬性“中文名”設(shè)為“人”。

          這樣以后才能真正的建立一個廣泛的可共享的概念體系:這時候我們?nèi)绻枰獧z索“人”這個概念的時候,可以檢索出使用不同語言標(biāo)注出來的信息,也可以使用任何一種語言進(jìn)行檢索。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多