|
今天早上人民日?qǐng)?bào)刊文《不能讓算法決定內(nèi)容》對(duì)“各類信息網(wǎng)站、app、搜索引擎以算法為工具,一切圍著流量轉(zhuǎn),唯點(diǎn)擊量、轉(zhuǎn)發(fā)量馬首是瞻,標(biāo)題黨泛濫,價(jià)值取向跑偏,內(nèi)容淪為附庸”的情況進(jìn)行了批判,以下是我的觀點(diǎn)。 人類社會(huì)的文明史其實(shí)是人類對(duì)于這個(gè)世界的探索和理解的過程,人類社會(huì)取得的一切進(jìn)步都可以歸結(jié)為人類對(duì)這個(gè)世界的更深入的理解。過去人們是怎么理解這個(gè)世界的呢?通過觀察、閱讀、體驗(yàn)等進(jìn)行信息收集,然后匯總到大腦進(jìn)行邏輯性思考,理解其間的邏輯,同時(shí)預(yù)示未來的發(fā)展。 這是人類大腦特有的邏輯推理能力。而今天,大數(shù)據(jù)有可能在在人類大腦之外,獨(dú)立建立起一套完整的邏輯推理體系,對(duì),通過算法! 大數(shù)據(jù)的實(shí)質(zhì)是物理世界的數(shù)據(jù)“映像”,是事與事、物與物、事與物的相互聯(lián)系,是對(duì)規(guī)律的揭示,是對(duì)未來的預(yù)判。因此,“關(guān)系”是大數(shù)據(jù)算法中最核心的精髓,沒有對(duì)數(shù)據(jù)間關(guān)系的準(zhǔn)確定義,沒有科學(xué)的算法,再多、再大的數(shù)據(jù)都沒用。 那怎么來建立一個(gè)(一組?一群?一堆?一個(gè)集合?)科學(xué)有效的算法呢?當(dāng)前大部分號(hào)稱運(yùn)用大數(shù)據(jù)實(shí)現(xiàn)科學(xué)推送的網(wǎng)站和app的觀點(diǎn)是,算法本身并不去理解它所處理的內(nèi)容的實(shí)質(zhì)是什么,算法只負(fù)責(zé)分類集合、關(guān)鍵詞搜索、關(guān)鍵詞刻本內(nèi)涵記憶,邏輯梳理及建構(gòu),反饋優(yōu)化。 這是正確的觀點(diǎn)嗎?一群精通技術(shù)的數(shù)學(xué)家在絞盡腦汁地建構(gòu)著復(fù)雜而龐大的模型去試圖從文本、信息本身去定義其讀者。這是否符合我們?nèi)ダ斫膺@個(gè)世界的要求?通過這樣的方式表達(dá)出來的世界與真實(shí)的世界是否一致?有人說,算法的行為很有趣,好像在努力用各種辦法躲避對(duì)內(nèi)容靈魂本身的認(rèn)知,只通過外表的形式特征去猜內(nèi)容的相關(guān)度。 大數(shù)據(jù)總是很技術(shù)地定義了我的愛好和興趣,根據(jù)其僵化的算法和遵循的規(guī)則,我打開今日頭條app只能看見“恒大“、“曼聯(lián)”、“周星馳”、“騎行”、“旅行”等等相關(guān)的信息,甚至信息的細(xì)致度已經(jīng)細(xì)化到恐怖的程度,以至于我都知道盧卡庫(kù)9月份進(jìn)了幾個(gè)球,在哪場(chǎng)球第幾分鐘進(jìn)的球,穆里尼奧為什么露出邪魅般的微笑,等等,而其實(shí)我并不需要、并不太想知道這些,但我只能看到他們讓我看的,這些信息占據(jù)了我的手機(jī)屏幕。 誠(chéng)然,它給我推薦的似乎都是我的興趣點(diǎn),但我想,人不能總活在一個(gè)框框里,人是一個(gè)由各種情緒混合支配的綜合體,并不總是保持理智和運(yùn)行在同一個(gè)軌道,就正如開發(fā)者們總覺得一個(gè)app能讓人保持健康飲食,保持固定運(yùn)動(dòng),但人總是貪吃和懶惰的,正如我也不是天天只愛看美女,有時(shí)候我也想看看中古時(shí)期的歐洲歷史。 而“大數(shù)據(jù)”目前似乎還不知道這些,并不是我的文藝氣息隱藏得太深,而是今天的算法太二了。大數(shù)據(jù)能發(fā)揮作用的基礎(chǔ)是標(biāo)簽化,它要知道我是誰,才能知道我想要什么。但大數(shù)據(jù)跟我是不熟的,沒有和我徹夜聊天,沒有和我長(zhǎng)途旅行,也沒有那些恩怨情仇,甚至它連我長(zhǎng)什么樣都不知道。要識(shí)別我是誰,只能通過給我打標(biāo)簽的方式。但在數(shù)據(jù)源無法保證充足的情況下,標(biāo)簽化是不科學(xué)的。舉個(gè)例子來說,我花在網(wǎng)上購(gòu)物上的錢多,大數(shù)據(jù)就把我標(biāo)簽為消費(fèi)水平高,是高收入群體,其實(shí)我是為了省錢才網(wǎng)購(gòu)的,大數(shù)據(jù)無法記錄我在菜市場(chǎng)為了5毛錢和攤主爭(zhēng)論了半小時(shí),大數(shù)據(jù)無法監(jiān)控我的錢包從未出現(xiàn)過百元及以上面額鈔票。 在“點(diǎn)擊什么標(biāo)題=我是什么人”這樣的荒唐邏輯下,在這種錯(cuò)誤的標(biāo)簽化的引導(dǎo)下,大數(shù)據(jù)開始堂而皇之地定義我的生活,讓我鉆入了一條越走越狹小,越走越深的胡同,他們給我看他們以為我想看的信息,他們給我推薦他們以為我想買的物品,他們給我灌輸他們以為符合我的正確價(jià)值觀,他們給我引導(dǎo)他們以為合理的行為方式……而這一切之后,在胡同的盡頭,我只能看見大數(shù)據(jù)這塊鏡子里的自己。 我覺得,算法不應(yīng)該是一個(gè)純技術(shù)的問題,不光是一個(gè)數(shù)學(xué)的問題,同時(shí)也是一個(gè)社會(huì)學(xué)的問題,是一個(gè)心理學(xué)的問題,一個(gè)組織行為學(xué)的問題,一個(gè)綜合各種學(xué)科的問題。人們不光要理解數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,還要理解這些數(shù)據(jù)背后代表的意思,進(jìn)而理解人與人的關(guān)系,人與物的關(guān)系,人與世界的關(guān)系。這時(shí)候,算法就不是一個(gè)牛逼的邏輯學(xué)家能解決的問題,這不光是一個(gè)人的問題,甚至需要一個(gè)/幾個(gè)組織去共同完善。 這與物理學(xué)的定理的推理類似。舉個(gè)例子,人類發(fā)展至今誕生了無數(shù)偉大定理,但我相信沒有一個(gè)物理學(xué)家從一開始就能把這條公式中的所有因子、參數(shù)以及彼此間的關(guān)系都能明確出來。物理學(xué)家的任務(wù)是用數(shù)學(xué)語言(方程)描述物理量之間的關(guān)系,人們往往關(guān)注方程的推理過程,而物理學(xué)家真正的價(jià)值在于怎樣組織這個(gè)方程,怎么把這個(gè)架構(gòu)給構(gòu)架出來,怎么從感性上把這種關(guān)系給描述出來,而方程只是一種外在的呈現(xiàn)方式。如“薛定諤公式”就是薛定諤憑感覺猜出來的,誰也不知道他是怎么猜的。所以最具價(jià)值的是“物理學(xué)家是怎樣形成新的觀點(diǎn)的”,而不是怎樣通過數(shù)學(xué)符號(hào)給表達(dá)出來。每一個(gè)偉大的方程都是出于物理學(xué)家超出前人的遠(yuǎn)見,但這種遠(yuǎn)見并非憑空想象,其出于其深厚的物理研究功底,頻繁而深沉的思考,勇于打破思想的藩籬,高出常人的思想。 算法只是一條公式,重要的不在于算法本身,而在于我們是如何理解這個(gè)世界,并且把這種理解用可實(shí)現(xiàn)的方式表達(dá)出來。 |
|
|