小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

吳顏談WEB3.0之二 互聯(lián)網(wǎng)垃圾信息的來源及解決方法(下)

 頤和 2005-12-08
        還有一種垃圾信息,我們可以稱為虛假信息,或非權(quán)威信息。這樣的信息也是非常多的。往往我們也是無法辨別的。也就是這樣的原因,我們往往更相信一些官方網(wǎng)站所報(bào)道的信息,因?yàn)槲覀冎?,他們一般是不敢亂說的。也就是因?yàn)檫@樣,很多假信息都是披著權(quán)威媒體的羊皮而跳出來的,相信大家不止一次的聽到報(bào)道說,誰誰誰,模仿什么什么網(wǎng)站的設(shè)計(jì)并網(wǎng)址發(fā)放什么什么虛假信息。也就在3天前,我還聽到報(bào)道說,一位日本青年申請了一個(gè)和雅虎很像的網(wǎng)址,有設(shè)計(jì)了和雅虎一樣的網(wǎng)頁,在上面報(bào)道說中國正在偷襲日本,并向日本開戰(zhàn)了的假消息,引起了很大的騷亂。這個(gè)事件也更清楚的說明了,只從信息的包裝來判斷信息的真?zhèn)问遣粔虻?。還有一個(gè)例子就是,如果現(xiàn)在有一篇文章,里面有很多種數(shù)據(jù),而文章也說明這些數(shù)據(jù)都是權(quán)威部門得到的,這個(gè)時(shí)間如果你要驗(yàn)證,我想是很困難,最起碼是需要花上一些時(shí)間的。而網(wǎng)絡(luò)作為信息載體的特質(zhì)和信息在紙上記錄時(shí)期所具有的差異是根本性的。信息在紙上存在的時(shí)期,是受紙空間限制的,而網(wǎng)絡(luò)時(shí)期,信息在網(wǎng)頁上體現(xiàn)的時(shí)間,是作為全球信息的一個(gè)單位出現(xiàn)的,背后是有程序和無限的信息空間做支撐的。所以說,如果在互聯(lián)網(wǎng)時(shí)期,還能把在紙媒體時(shí)代起效的欺騙方法搬到網(wǎng)絡(luò)資訊時(shí)期,只能說明網(wǎng)絡(luò)資訊時(shí)期還處于一個(gè)非常初級的萌芽狀態(tài)。
        而WEB3.0時(shí)期的信息存在形式是和以往的存在的形式是完全不一樣的。每個(gè)信息的最小單位,哪怕是一個(gè)統(tǒng)計(jì)數(shù)據(jù),在表面上看,是一個(gè)簡單的阿拉伯?dāng)?shù)字,但是在信息包內(nèi)部,還包含了,這個(gè)信息的出處、信息產(chǎn)生的時(shí)間并信息的可信度等級等一系列屬性信息。而這些信息是公用數(shù)據(jù)平臺可以自動(dòng)識別的。例如。雖然一個(gè)計(jì)算機(jī)銷售商只是向自己網(wǎng)絡(luò)商城一款計(jì)算機(jī)產(chǎn)品錄入了一條價(jià)格。但是公用數(shù)據(jù)平臺在記錄上價(jià)格信息后,還會(huì)把這個(gè)價(jià)格信息的相關(guān)屬性打包記錄,這個(gè)包里還包含這個(gè)信息是誰在什么時(shí)間記錄的什么產(chǎn)品的什么類型的價(jià)格,這條信息的可信性是高還是低等。 而另外一個(gè)媒體的編輯也在自己的網(wǎng)站為同樣一款產(chǎn)品錄入一條價(jià)格的時(shí)間。就是價(jià)格信息是完全一樣的,例如都是500元,但是由于信息屬性內(nèi)容不一樣,所以這個(gè)500并不等于另外一個(gè)500。而信息的可信度上,商家的也比媒體的高,因?yàn)樯碳以谏坛撬浀膱?bào)價(jià)是要直接銷售的,而媒體編輯的價(jià)格只是供人參考的,也就是說價(jià)格的錄入方和錄入地等信息產(chǎn)生的環(huán)境決定了信息的真實(shí)程度。所以說,既然連組合成文章的最小單位,文字和數(shù)據(jù)都包含豐富的屬性信息了,而什么文章的可信度高,什么文章的可信度低就自然更容易分辨了。而網(wǎng)民在瀏覽帶有數(shù)據(jù)的文章時(shí),也可以隨時(shí)查看數(shù)據(jù)的屬性以了解起真實(shí)程度。如果你去引用別人的數(shù)據(jù)時(shí),其實(shí)你也把對方數(shù)據(jù)的屬性信息一起引用了,因?yàn)樵跀?shù)據(jù)包里,是一定數(shù)據(jù)屬性信息的。既然如此。WEB3.0時(shí)期的網(wǎng)站和軟件商就可以很容易在信息體現(xiàn)的時(shí)間過濾掉可信度低的信息。網(wǎng)民在看信息的時(shí)間,也可以通過設(shè)置可信度相應(yīng)的數(shù)值來過濾內(nèi)容不真實(shí)的垃圾信息了。如此看來?,F(xiàn)在的我們所說的WEB2.0之前時(shí)期,只是把人們把紙媒體時(shí)期的信息開始搬遷到互聯(lián)網(wǎng)上來了,但是在搬遷的時(shí)間,還是保留了信息在紙上所具有的形式。文章里的各單位的信息都是孤立和凌亂的,只是排列和展現(xiàn),你無法看到字以下還有什么。
        第三種垃圾信息,我們稱之為重復(fù)信息。如果你去搜索一個(gè)關(guān)鍵字,結(jié)果搜索出300條重復(fù)的新聞,你會(huì)認(rèn)為有299條信息是沒有用的垃圾信息,而事實(shí)上我們幾乎每天都從事著從大量重復(fù)信息中挑選不重復(fù)信息并瀏覽的工作。這些重復(fù)信息不僅浪費(fèi)了我們寶貴的時(shí)間,還嚴(yán)重的浪費(fèi)了網(wǎng)絡(luò)資源,而這些重復(fù)信息的生成也是有很多原因造成的。最大的原因就是因?yàn)楦鱾€(gè)網(wǎng)站都是封閉的。別人網(wǎng)站上的信息只有拷貝到自己網(wǎng)站上一份以后,自己的網(wǎng)站上才可以看到這樣的信息,而為了起到擁有最多的信息,吸引最多網(wǎng)民的目的,各個(gè)網(wǎng)站都在瘋狂的充實(shí)自己的內(nèi)容。由于編輯不同和系統(tǒng)無法自動(dòng)識別重復(fù)信息,很多網(wǎng)站內(nèi)部都有很多重復(fù)信息,就更不要提網(wǎng)絡(luò)上了??梢院敛豢鋸埖恼f,目前網(wǎng)絡(luò)上的信息至少有70%是重復(fù)的。既然如此,消除重復(fù)垃圾信息的最直接的方法就是消除網(wǎng)站和網(wǎng)站并信息小區(qū)域的隔閡,把封閉的信息容器變?yōu)殚_發(fā)的信息容器,用公用信息平臺記錄公用的信息類型,把對信息的引用和轉(zhuǎn)載,變成對信息ID的引用和轉(zhuǎn)載信息的記錄。這樣以來,標(biāo)準(zhǔn)的信息就實(shí)現(xiàn)了跨平臺流動(dòng)。各個(gè)網(wǎng)站也不用為了達(dá)到以提供更多信息的目的而把什么都放到怎么網(wǎng)站中了,因?yàn)槊總€(gè)網(wǎng)站其實(shí)都擁有了整個(gè)網(wǎng)絡(luò)的信息。既然大家的信息都很多。自然各自的競爭的重心就轉(zhuǎn)移到了,誰的信息更專業(yè)、誰的信息體現(xiàn)形式更友好,誰的網(wǎng)下服務(wù)和網(wǎng)上信息結(jié)合并互動(dòng)的更好。而這個(gè)時(shí)間,程序才能有能力對信息進(jìn)行識別,而過濾掉重復(fù)信息,如果多媒體對同一文章的轉(zhuǎn)載,也只要列出一個(gè)轉(zhuǎn)載媒表就可以了。用戶瀏覽起來會(huì)感覺很清爽和有秩序。 而搜索引擎的開發(fā)也可以有能力對重復(fù)信息做過濾并基于WEB3.0開發(fā)出具有“多關(guān)鍵字有邏輯的精確搜索”并具有智能搜索功能的下一代搜索引擎了。
        第四種垃圾信息我們統(tǒng)稱為不健康信息。其實(shí)在講第一種垃圾信息。信息在哪里體現(xiàn)的時(shí)間已經(jīng)給包括了,并且我感覺,完全消除第四種垃圾的可能性在短時(shí)間是不可能的。只能把他們控制在一定條件下顯示,而不是象現(xiàn)在一樣泛濫。只有等到這個(gè)世界上沒有人想消費(fèi)這些信息了,這些垃圾也自然就消失了。但是目前的情況是,有很多人喜歡看這樣的信息,所以我們在這里不在做討論。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多