|
摘要 數(shù)字化的持續(xù)推進(jìn)使得數(shù)據(jù)已經(jīng)成為經(jīng)濟(jì)和社會(huì)生活的中心。我們生成的數(shù)據(jù)越來(lái)越多,數(shù)據(jù)交換、數(shù)據(jù)安全和數(shù)據(jù)分析的手段也愈發(fā)成熟。數(shù)據(jù)經(jīng)濟(jì)學(xué)定義了這些操作的價(jià)值。政府和大企業(yè)紛紛出臺(tái)數(shù)據(jù)政策。大數(shù)據(jù)作為一個(gè)全新產(chǎn)業(yè)如冉冉升起的新星,然而有關(guān)數(shù)據(jù)的本質(zhì)尚無(wú)定論。盧西亞諾·佛羅利迪(Luciano Floridi)帶領(lǐng)我們從哲學(xué)視角出發(fā)來(lái)重新審視數(shù)據(jù)的定義。 數(shù)據(jù)是什么?這個(gè)問(wèn)題早在19世紀(jì)末就被提出,但長(zhǎng)久以來(lái)一直被人們忽視。如今,數(shù)字技術(shù)的降臨使我們不得不重新回答并闡釋這一問(wèn)題。當(dāng)時(shí)有兩派,一派強(qiáng)調(diào)要記錄“意識(shí)的即刻數(shù)據(jù)”(柏格森);另一派強(qiáng)調(diào)用實(shí)驗(yàn)的方法對(duì)“客觀(guān)”數(shù)據(jù)進(jìn)行間接測(cè)量。 蒯因之后,科學(xué)的哲學(xué)很快拋棄了客觀(guān)的偽裝。但無(wú)論如何直到今天,所有關(guān)乎準(zhǔn)確無(wú)誤和現(xiàn)實(shí)主義的實(shí)踐思維、一切的科學(xué)手段,其基礎(chǔ)還是數(shù)據(jù)。 已知和未知 “數(shù)據(jù)”顧名思義,其意義既是外人賦予它的,也是它強(qiáng)加于人的。正因如此,它才能成為共同思考的基礎(chǔ),推動(dòng)技術(shù)發(fā)展,制定公共政策,促進(jìn)科學(xué)進(jìn)步。無(wú)人不使用數(shù)據(jù):工程師、經(jīng)濟(jì)學(xué)家、物理學(xué)家、植物學(xué)家、農(nóng)學(xué)家、化學(xué)家······ 數(shù)據(jù)是已知的領(lǐng)域,它帶著我們?nèi)ヌ剿魑粗?/p> 但就何為已知,各方須達(dá)成共識(shí)、表示認(rèn)可。簡(jiǎn)單說(shuō)來(lái),這要求某種自我證明或是約定俗成,讓共同反思的各方就什么是“已知”達(dá)成一致。數(shù)據(jù),無(wú)論關(guān)乎科學(xué)、技術(shù)或是社會(huì)科學(xué),提供的都是可解讀的、站得住腳的事實(shí)。這些事實(shí)要么向公眾開(kāi)放,要么至少在承認(rèn)其價(jià)值的使用者社群里共享。 從這個(gè)角度來(lái)說(shuō),定量數(shù)據(jù)相較定性數(shù)據(jù)有一個(gè)難以辯駁的優(yōu)勢(shì)——就數(shù)字達(dá)成一致比較容易,就性質(zhì)達(dá)成一致比較難。正因如此,現(xiàn)代科學(xué)和工程尋求量化指標(biāo),用數(shù)字來(lái)描述事物屬性。比如灰色不再是一種介于黑白之間的顏色,而是25%或是70%的黑色。任何圖像都能被分割成像素,而任何一個(gè)像素都有帶有數(shù)字價(jià)值,其范圍介于紅外線(xiàn)和紫外線(xiàn)之間。 因此,所謂的世界的數(shù)字化不僅僅意味著所有的傳輸信號(hào)都可以用0和1表示,而是說(shuō)在全球范圍內(nèi),我們所能感知的世界——包括人類(lèi)——都被轉(zhuǎn)化成了數(shù)據(jù)序列。這一轉(zhuǎn)化始于現(xiàn)代之初,而當(dāng)今我們正在經(jīng)歷這一進(jìn)程的加速。 這種加速還帶來(lái)了另一個(gè)變化,那就是它把分析學(xué)變成了推測(cè)學(xué)。過(guò)去對(duì)于原理機(jī)制一絲不茍而又嚴(yán)格縝密的推斷被通過(guò)數(shù)據(jù)挖掘帶來(lái)的對(duì)于統(tǒng)計(jì)規(guī)律的事后揭示所取代。這場(chǎng)剛剛才開(kāi)始的革命可以被看作歸納思維對(duì)于演繹思維的勝利。在越來(lái)越多的領(lǐng)域,知識(shí)的基礎(chǔ)是從海量數(shù)據(jù)中提取出來(lái)的相關(guān)性。人們不再試圖證明規(guī)律,而只是觀(guān)察規(guī)律的表征。 統(tǒng)計(jì)數(shù)據(jù)和算法成了知識(shí)以及決策的基本工具。 這是一場(chǎng)革命,其驅(qū)動(dòng)力是存儲(chǔ)在巨型數(shù)據(jù)存儲(chǔ)中心的海量數(shù)據(jù)。既然我們所有人都身處其中,就不得不審視這些數(shù)據(jù)及其重要性。第一個(gè)問(wèn)題,很簡(jiǎn)單但也很根本:數(shù)據(jù)和信息有何區(qū)別? 信息原子 二者之間的差異很重要,也是事實(shí)——知識(shí)這一鏈條的組成部分。 瑞典皇家理工學(xué)院的哲學(xué)教授斯文·奧維·漢森(Sven Ove Hansson)在他2002年的一篇文章中曾經(jīng)這樣總結(jié)過(guò)數(shù)據(jù)、信息和知識(shí)的差別:“數(shù)據(jù)有別于信息,因其吸收不需要借助某一特定形式。比方說(shuō),如果我現(xiàn)在不讀這本(社會(huì)學(xué)的)書(shū),而是讀這本書(shū)基于的幾萬(wàn)份調(diào)查問(wèn)卷,那么我讀的就是數(shù)據(jù)而非信息。簡(jiǎn)單說(shuō)來(lái),數(shù)據(jù)要能被處理才能成為信息,要能被吸收才能成為知識(shí)?!?/p> 事實(shí)上,漢森談及的數(shù)據(jù)、信息和知識(shí)之間的差別羅杰·波恩(Roger Bohn)早在1994年的一期《斯隆管理評(píng)論》中就有闡述。數(shù)據(jù)來(lái)自傳感器,衡量任意指定變量的價(jià)值。如果按照特定結(jié)構(gòu)組織起來(lái),數(shù)據(jù)就成了信息,在特定情境下,這些信息持之有故。知識(shí)更進(jìn)一步:知識(shí)幫助人做出預(yù)測(cè)、建立因果關(guān)系或者做出決策。 價(jià)值來(lái)自知識(shí)。但是正如波恩所說(shuō),相較于信息,存儲(chǔ)、描述、處理信息更容易。那么數(shù)據(jù)是否也是如此呢? 如果光看數(shù)值,答案是肯定的:一份數(shù)據(jù)其實(shí)就像是一個(gè)信息原子,是特定時(shí)間內(nèi)和空間中的一個(gè)最小測(cè)量單位。簡(jiǎn)單說(shuō)來(lái),它可以用0或1來(lái)表示。 從哲學(xué)角度看,描述數(shù)據(jù)比描述信息更容易。數(shù)據(jù)的概念更簡(jiǎn)單、挑戰(zhàn)性也更小。一份數(shù)據(jù)是對(duì)于一個(gè)事實(shí)最直接、最如實(shí)的表達(dá)。但是數(shù)據(jù)不等于事實(shí);它只是人類(lèi)為定義一個(gè)事實(shí)所用的最小觀(guān)察單位。 要說(shuō)數(shù)據(jù)是完全客觀(guān)的、不帶任何意圖或投射,那是癡人說(shuō)夢(mèng)。一個(gè)現(xiàn)象可以測(cè)量的方面眾多,偏偏選擇測(cè)量某一特定變量,而不是另外一個(gè)變量,這種選擇本身已經(jīng)規(guī)定了你想要知道的現(xiàn)實(shí)。 但一般由傳感器生成的數(shù)據(jù)還是在兩個(gè)方面體現(xiàn)出了客觀(guān)性:第一是數(shù)據(jù)里包含的極少量的信息;二是其他傳感器的存在(這些傳感器更好的幫助再現(xiàn)對(duì)于某一現(xiàn)象的觀(guān)察,比方說(shuō)要了解你車(chē)的右前輪的狀態(tài),可以收集它的熱度、震動(dòng)、氣壓、年齡、使用年限等等數(shù)據(jù),你的車(chē)載電腦就能通過(guò)這些參數(shù)提供高度可靠的信息)。 數(shù)據(jù)的語(yǔ)義定義 前述討論也可以反過(guò)來(lái)看。一方面,它們強(qiáng)迫我們做出選擇、過(guò)濾數(shù)據(jù),來(lái)重建一個(gè)簡(jiǎn)化的現(xiàn)實(shí)。 另一方面,對(duì)于客觀(guān)性的追求、傳感器的無(wú)處不在以及收集的數(shù)據(jù)的指數(shù)性增長(zhǎng)預(yù)示著這樣一個(gè)科學(xué)幻想——現(xiàn)象的全方位再現(xiàn)、世界的絕對(duì)數(shù)字化??茖W(xué)后果:研究某塊骨頭的病理時(shí),我們使用來(lái)自10萬(wàn)名患者的10萬(wàn)組極其完整的數(shù)據(jù)。我們有了前所未有的機(jī)會(huì)去理解一個(gè)現(xiàn)象,或者至少完整記錄這一現(xiàn)象,沒(méi)有任何遺漏。深入到日常:連接的人類(lèi)。每秒鐘傳感器都分析著你的血壓;你在宇宙中的位置不斷被捕捉。你也經(jīng)歷了轉(zhuǎn)變,成了數(shù)據(jù)生成者,而且生成的量越來(lái)越大。最終,這些數(shù)據(jù)價(jià)值幾何呢?換句話(huà)說(shuō),數(shù)據(jù)怎么樣才能成為事實(shí)——信息——知識(shí)這一鏈條的一部分呢? 把數(shù)據(jù)理解成信息的原子的理論局限性就在于它無(wú)法解釋這一轉(zhuǎn)變的方方面面。而牛津互聯(lián)網(wǎng)學(xué)院(Oxford Internet Insititue)的哲學(xué)教授和研究主任盧西亞諾·佛羅利迪(Luciano Floridi)看待該問(wèn)題的角度打破了這種局限性。 他對(duì)于以數(shù)據(jù)為基礎(chǔ)來(lái)定義信息是否可行提出了質(zhì)疑。換句話(huà)說(shuō),他通過(guò)問(wèn)“什么使得數(shù)據(jù)能夠產(chǎn)生信息?”來(lái)懷疑數(shù)據(jù)的語(yǔ)義定義。 首先,他采用了一個(gè)十分嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)定義:“數(shù)據(jù)是在某一情境下有關(guān)差異或統(tǒng)一性缺乏的推定事實(shí)”。 這一現(xiàn)實(shí)架構(gòu)中的差異在特定條件下使得信息成為可能。佛羅利迪提出了三個(gè)先決條件:1)要求一份或更多數(shù)據(jù);2)這些數(shù)據(jù)必須是可取的,即它們必須是根據(jù)特定規(guī)則組合起來(lái)的;3)這些數(shù)據(jù)是有意義的,即可以通過(guò)不同方式去闡釋、翻譯或表達(dá)。 由此,數(shù)據(jù)可以被定義為一個(gè)關(guān)系實(shí)體,這是其十分關(guān)鍵的一個(gè)特點(diǎn)。 要理解這一特點(diǎn),我們可以看看佛羅利迪的理論是如何闡明“差異”和“統(tǒng)一性缺乏”這兩個(gè)概念的。根據(jù)佛羅利迪,這兩個(gè)概念涉及希臘人所說(shuō)的“diaphora”,即缺口。他提出了“數(shù)據(jù)的缺口定義”,適用于三個(gè)層面。 第一層,數(shù)據(jù)可以被定義為“diaphora de re”,即現(xiàn)實(shí)中統(tǒng)一性之缺乏。對(duì)于“自然界里的數(shù)據(jù)”目前并無(wú)標(biāo)準(zhǔn)說(shuō)法。一種叫法是把數(shù)據(jù)稱(chēng)作“dedomen”(這是英文詞數(shù)據(jù)data的古希臘文翻譯)。此外應(yīng)該注意到,從詞源的角度來(lái)說(shuō),數(shù)據(jù)的拉丁文中是“datum”,其最早出現(xiàn)在歐幾里得的一本名叫Dedomena的作品的譯本里。人不能直接認(rèn)識(shí)數(shù)據(jù),而是通過(guò)經(jīng)驗(yàn)推斷出來(lái)。 佛羅利迪解釋說(shuō),“dedomena”是純粹的數(shù)據(jù)或是原型認(rèn)識(shí)論數(shù)據(jù),即還未從認(rèn)識(shí)論的角度被解讀過(guò)的數(shù)據(jù)。作為“現(xiàn)實(shí)架構(gòu)中的斷裂”,人們既無(wú)法接近它們,也不能抽象地對(duì)其進(jìn)行獨(dú)立的闡釋?zhuān)矡o(wú)法從認(rèn)識(shí)論的角度去體會(huì)它們;其存在是憑經(jīng)驗(yàn)推導(dǎo)出來(lái)的(也是經(jīng)驗(yàn)要求的)。 除了原型認(rèn)識(shí)論數(shù)據(jù),數(shù)據(jù)還是兩種物理狀態(tài)間的“diaphora de signo”,即統(tǒng)一性之缺乏:一個(gè)電池不同的電量,一通電話(huà)的電信號(hào)或者摩爾斯電碼的一個(gè)點(diǎn)。 最后一個(gè)層面,數(shù)據(jù)是“diaphora de dicto”,即兩個(gè)符號(hào)間統(tǒng)一性之缺乏,比如拉丁字母表里的A和B。 “diaphora”這一概念提綱挈領(lǐng)的提出了數(shù)據(jù)的三個(gè)層面,它指出了一種分歧:事物開(kāi)始產(chǎn)生差異的時(shí)刻;我們需為這一差異尋找意義。數(shù)據(jù)是象征性實(shí)體,它將這種差異符號(hào)化,它的兩端,一頭是(很容易被稱(chēng)作無(wú)關(guān)緊要的)差異,另一頭是意義。最終,數(shù)據(jù)是一個(gè)臨界點(diǎn),從這里開(kāi)始,無(wú)關(guān)緊要變得舉足輕重。 布魯諾·特博爾 高級(jí)副總裁,科學(xué)與創(chuàng)新部,奇利匙集團(tuán) 布魯諾·特博爾,巴黎綜合理工學(xué)院哲學(xué)學(xué)士,認(rèn)知科學(xué)碩士(聯(lián)合碩士,與巴黎高等師范學(xué)院、法國(guó)社會(huì)科學(xué)高等學(xué)院和巴黎文理研究大學(xué)聯(lián)合授予),巴黎高等商學(xué)院高級(jí)工商管理碩士,巴黎第九大學(xué)博士。超過(guò)20年大型企業(yè)工作經(jīng)驗(yàn)(包括Boulanger、歐迪辦公、碧諾-春天-雷都、法國(guó)郵政、老佛爺百貨、家樂(lè)福、Devoteam),主要負(fù)責(zé)營(yíng)銷(xiāo)和數(shù)字化管理。 他同時(shí)還是一名互聯(lián)網(wǎng)企業(yè)家(1998年QXL,2006年BrandAlley)。2013年起,他成為奇利匙集團(tuán)科學(xué)與創(chuàng)新部高級(jí)副總裁以及巴黎綜合理工學(xué)院數(shù)據(jù)科學(xué)家主席治理委員會(huì)成員(奇利匙、泰雷茲集團(tuán)和Orange)。 他的研究工作跨越多個(gè)學(xué)科(哲學(xué)、經(jīng)濟(jì)學(xué)、數(shù)字技術(shù)),圍繞對(duì)于數(shù)字化顛覆以及其社會(huì)影響的分析展開(kāi)。他發(fā)表文章眾多,出版多部作品,著名的包括《經(jīng)濟(jì)的優(yōu)步化》(優(yōu)步化=經(jīng)濟(jì)顛覆?Kawa, 2015年3月)以及《大數(shù)據(jù)》(數(shù)據(jù)非既定—大數(shù)據(jù)與戰(zhàn)略,Kawa, 2016年7月)。 |
|
|
來(lái)自: 全性保真 > 《數(shù)學(xué)》