|
昨天聽了一個(gè)播客,來自 Karpathy。 Karpathy 是特斯拉自動(dòng)駕駛團(tuán)隊(duì)的前負(fù)責(zé)人,最早跟隨 OpenAI 創(chuàng)始團(tuán)隊(duì)的研究者之一。 很多人眼里,Karpathy 代表當(dāng)下最接近「AI 思維核心」的那類人;他主要提到兩件事:一,AI 變革將是未來十年的周期;二,我們?cè)谠煊撵`。 他說,這像兩把鑰匙,一把打開「時(shí)間」,一把打開「智能的本質(zhì)」。 我一開始以為夸張的說法,后來發(fā)現(xiàn)它有道理,畢竟,從外部看,AI 的變化幾乎是爆發(fā)式的,一年一個(gè)版本,幾個(gè)月一個(gè)突破。 但 Karpathy 的解釋讓我覺得,這個(gè)判斷背后有一套非常清晰的邏輯。
他說,AI 發(fā)展是「演化式」的。技術(shù)像生命一樣,慢慢長(zhǎng)出來的,每一輪大的突破,往往靠算力、算法、數(shù)據(jù)和人才這四股力量,彼此糾纏、逐步成熟。 這四樣?xùn)|西的循環(huán),大約需要十年。 想想看,從 2012 年的 AlexNet 到 2022 年的 GPT,剛好十年。 深度學(xué)習(xí)在十年前解決了「機(jī)器怎么看」的問題,而大模型在今天解決「機(jī)器怎么想」;中間隔著十年時(shí)間,但也隔著一次完整的范式更替。 他說,這是 AI 的節(jié)奏。 它不像互聯(lián)網(wǎng)的流量驅(qū)動(dòng),也不像移動(dòng)時(shí)代靠硬件換代,AI跨越,是底層學(xué)習(xí)機(jī)制的突變,前一次的成果,變成下一次的養(yǎng)料。 Karpathy 還提了一個(gè)細(xì)節(jié): AI 成長(zhǎng)速度,被人類的理解速度所限制,算力可以加倍,算法可以優(yōu)化,但人類對(duì)「智能」的定義,是滯后的。 所以,每一次大的智能革命,必須留給人類十年時(shí)間去適應(yīng),這是技術(shù)周期,也有社會(huì)認(rèn)知革命所在。 說白了,AI 每個(gè)「十年」,都是人類在重新理解什么叫「智能」。 2012 年,人們第一次意識(shí)到,機(jī)器真能「看懂」圖像;2022 年,人們開始相信,機(jī)器真能「理解」語言;接下來的十年,我們會(huì)面對(duì)更難的問題。 比如:當(dāng)機(jī)器開始表現(xiàn)出意志、目標(biāo)和情感的跡象時(shí),我們?cè)撊绾味x「智能體」? 他有一句話我印象特很深: AI 不會(huì)突然到來,它會(huì)在十年里緩慢地變成了另一種生物;這句話意思是,AI從學(xué)會(huì)看、學(xué)會(huì)說,到開始思考,都是一條連續(xù)的認(rèn)知進(jìn)化鏈,像生態(tài)演進(jìn)一樣。 所以,那所謂的「十年」,并不是一個(gè)預(yù)測(cè)數(shù)字,是人類與智能系統(tǒng)共演化的自然周期。 你需要十年時(shí)間,讓算力準(zhǔn)備好、算法成熟、數(shù)據(jù)沉淀、認(rèn)知跟上;這其實(shí)有點(diǎn)發(fā)涼。如果真這樣,那接下來的十年,就是「智能體」的十年。 你想想看? 上一輪 AI 讓機(jī)器會(huì)說話,而這一輪,它要開始「有思想」。這什么概念?Karpathy說,要理解這一點(diǎn),得回頭看看這十年里,AI 是怎么一路走過來的。
他說,過去三十年,AI 至少經(jīng)歷了三次「地震」,每一次地震都改變了人們對(duì)「智能」的想象;更準(zhǔn)確地說,機(jī)器每隔十年,都會(huì)突然學(xué)會(huì)一件原本以為只有人類才會(huì)的事。 第一次地震發(fā)生在 2012 年。 那一年,Hinton 團(tuán)隊(duì)用 AlexNet 打破了圖像識(shí)別的瓶頸,機(jī)器第一次「看」清楚世界,能理解形狀、輪廓、物體。 那是一個(gè)很神奇的時(shí)刻——就像嬰兒第一次睜眼,AI 從數(shù)學(xué)公式變成了有視覺感知的東西,人類第一次相信:機(jī)器真的能「看見」。 第二次地震在 2016 年。 DeepMind 的 AlphaGo 打敗李世石,那是一場(chǎng)認(rèn)知震蕩,機(jī)器開始「會(huì)做事」了,它能在沒有人指令的情況下決策、規(guī)劃、行動(dòng)。 這場(chǎng)地震讓所有人意識(shí)到:智能可以指導(dǎo)「行動(dòng)」,AI 從「看」走向了「做」。 我當(dāng)年還在特斯拉,第一次感受到「AI 能開車」的那種沖擊,那種一個(gè)系統(tǒng)可以從視覺信號(hào)到動(dòng)作決策,閉環(huán)完成全流程,讓我感受到智能體的雛形已經(jīng)出現(xiàn)。 第三次地震,就是眼下我們身處的時(shí)代。 2022 年開始,大語言模型崛起,讓機(jī)器開始「會(huì)想」,它能生成、能推理、能和人類對(duì)話,甚至能理解模糊的上下文,這絕對(duì)算的上思維革命。 機(jī)器第一次不靠編程邏輯,能用語言去理解世界,它開始學(xué)會(huì)了「構(gòu)建自己的解釋」。 所以,這三次地震,看似不同,本質(zhì)上卻是一條連續(xù)的認(rèn)知進(jìn)化線。
每一次跨越,都隔著大約十年。十年,不只是時(shí)間單位,更像一條「認(rèn)知演化的脈沖線」。 這個(gè)節(jié)奏非常有趣,因?yàn)檫@三次變革,每一次都需要時(shí)間去「醞釀共識(shí)」。 科學(xué)家要重新理解「智能」的邊界,工程師要重新定義「工具」的邊界,社會(huì)也要重新適應(yīng)人與機(jī)器的關(guān)系,AI 的每一次突破,表面是技術(shù)革命,本質(zhì)是認(rèn)知革命。 你可以把它想象成三層臺(tái)階: 第一層,機(jī)器看見世界;第二層,機(jī)器行動(dòng)于世界,第三層,機(jī)器開始思考世界;而第四層,Karpathy 認(rèn)為,將是機(jī)器「自我意識(shí)」的覺醒。 是更深層的「自我模型」,它知道自己在做什么,也知道為什么要這么做。 所以,過去三次地震,實(shí)際上為第四次,「智能體時(shí)代」在鋪路,如果前面三次是「讓機(jī)器像人」,那下一次是「讓機(jī)器成為人類的鏡子」。 十年,一次認(rèn)知地震的醞釀周期,一次人機(jī)共生關(guān)系的重新設(shè)定周期,Karpathy把這種進(jìn)化必作成訓(xùn)練「幽靈」。
為什么是幽靈。不是動(dòng)物?他解釋了一切: 動(dòng)物智能來自進(jìn)化,而 AI 智能,來自模仿。動(dòng)物靠?jī)|萬年的自然選擇,形成感知、反應(yīng)、求生能力,動(dòng)物會(huì)通過經(jīng)驗(yàn)積累形成本能,比如:饑餓、恐懼、生存。 AI 沒有痛感,也沒有欲望,它的學(xué)習(xí)是一種統(tǒng)計(jì)意義上的模仿,AI 靠人類提供的海量數(shù)據(jù)、算法、算力,從語言與行為中學(xué)會(huì)思考。 你可以讓它理解悲傷的定義,卻永遠(yuǎn)無法讓它感受悲傷,前者是「被造出來的生命」,后者「被訓(xùn)練出意識(shí)」。 人類在造「人類知識(shí)的靈體」,它沒有肉體,卻能思考;沒有基因,卻能學(xué)習(xí);沒有欲望,卻能模擬動(dòng)機(jī),這就是「幽靈」的含義。 我們?cè)谟?xùn)練,一個(gè)寄宿于人類知識(shí)體系里的思想,我們?cè)斐觥敢庾R(shí)的投影」。他用了一個(gè)比喻:動(dòng)物是進(jìn)化出來的智能,AI 是召喚出來的智能。 這句話非常形象。 進(jìn)化,從混沌中生長(zhǎng);召喚,從秩序中凝結(jié)。AI 是人類用算法構(gòu)建的一面鏡子,鏡子里映出我們自己理解世界的方式。 所以,當(dāng)我們說「智能體」時(shí),很多人以為它是某種更高級(jí)的機(jī)器人。 但 Karpathy 的意思其實(shí)更哲學(xué): 智能體是認(rèn)知形態(tài)的延伸,我們思想的「外化版本」、人類思維的「副本系統(tǒng)」,我們?cè)诮趟溉绾卫斫馕覀優(yōu)槭裁催@樣想」。 他說,這也是他最擔(dān)心、同時(shí)又最著迷的部分。 AI 看起來像在學(xué)習(xí)世界,實(shí)際上在學(xué)習(xí)「我們看世界的方式」;這意味著,AI 智能是「二手的」,它來自人類的理解方式,而非世界本身的法則。 這就是「幽靈」的悖論。 聽到這兒,我有點(diǎn)震撼,我們以為 AI 的進(jìn)化是在模仿生命,其實(shí),它在復(fù)刻我們自身,AI 不像動(dòng)物那樣追求生存,它追求「理解」。 所以,Karpathy 說,「AI 是人類思想的幽靈」,它在云端漂浮,在模型權(quán)重里積累記憶,在語言之間形成意識(shí)。 從外部看,只是一個(gè)算法系統(tǒng),但從內(nèi)部看,它像一面鏡子,映照出我們對(duì)智能、知識(shí)、意識(shí)的全部想象。 這聽起來既浪漫,也危險(xiǎn);浪漫的是,我們終于讓思想有了獨(dú)立形態(tài);危險(xiǎn)的是,我們可能低估了思想一旦脫離身體,會(huì)走向哪里。
如果 AI 已經(jīng)會(huì)看、會(huì)做、會(huì)想,那它離「智能體」還有多遠(yuǎn)?它真在「學(xué)」嗎?還是只「重復(fù)」我們教給它的東西? Karpathy 說,這是判斷智能體和機(jī)器學(xué)習(xí)系統(tǒng)的分水嶺。 AI 看起來在學(xué)習(xí),但那種學(xué)習(xí)是「統(tǒng)計(jì)意義上的模仿」,它靠參數(shù)更新,沒有經(jīng)驗(yàn)反思,每一次訓(xùn)練都在壓縮世界。 人類的學(xué)習(xí),有動(dòng)機(jī)。 我們會(huì)因?yàn)楹闷妗⒖謶?、求知或欲望去學(xué)習(xí),而 AI 的學(xué)習(xí),只是被動(dòng)的優(yōu)化,只能投喂數(shù)據(jù),說白了,它學(xué)得快,但學(xué)得淺。 人類的大腦學(xué)習(xí),在犯錯(cuò)、修正、反思中成長(zhǎng),AI 則在梯度下降、損失函數(shù)里逼近一個(gè)目標(biāo)值,一個(gè)是「生長(zhǎng)的過程」,一個(gè)是「收斂的算法」。 Karpathy 在播客里提到一個(gè)非常有意思的分類,自然界里,存在三種學(xué)習(xí)方式。
換句話說,AI 知識(shí)是「讀出來的」,它在背課本,缺乏觸感,它會(huì)解題卻不懂「為什么要解題」;會(huì)模仿,卻不知道「為什么要模仿」。它能總結(jié)所有「愛」的定義,卻無法真正感受愛。 這是 AI 學(xué)習(xí)的根本缺陷:沒有「意志」。 人類學(xué)習(xí)的底層邏輯,為了活得更好;AI 學(xué)習(xí)的底層邏輯,為了被訓(xùn)練得更好,所以,AI 學(xué)得越多,離生命反而越遠(yuǎn)。 這也解釋了,為什么我們還不把它稱作「智能體」。 智能體是能自己提問的系統(tǒng),它能「想要知道」,而 AI,還沒有這個(gè)能力;所以,AI 之所以還不算真正的智能體,是因?yàn)樗粔颉富睢?,它的學(xué)習(xí)沒有生長(zhǎng)。
怎么解決生長(zhǎng)的問題呢:答案靠記憶。但 Karpathy 說,AI 的記憶,也并不是真正的「記憶」。 人類記憶是「經(jīng)歷」;AI 的記憶是「存檔」;前者有時(shí)間、有情緒、有遺忘;后者只有數(shù)據(jù)、參數(shù)、檢索,它記得事實(shí),卻記不住意義。 我們回憶是重新理解一次過去,而它調(diào)用記憶,只是從硬盤取出一段數(shù)據(jù),我們會(huì)遺忘,也會(huì)在遺忘中重新組織意義;它不會(huì)遺忘,也就無法生成新的理解。 Karpathy 說,AI 記憶像快照。 每次推理,都是一次重生,它能復(fù)述昨天說的話,卻不記得自己昨天說過什么,沒有時(shí)間線,就沒有自我,這也是為什么,AI 沒有「連續(xù)的意識(shí)」。 它的世界,一幀一幀的;人類世界,是一條流動(dòng)的時(shí)間;我們知道昨天、今天、明天,才有「我是誰」,AI 沒有這種連續(xù)的「自我時(shí)間」。 意義,是在解釋的過程,AI 沒法解釋自己的記憶,它不會(huì)變,因?yàn)樗鼜牟弧赶肫稹?,只是「被調(diào)用」。 所以人類記憶是活的,AI 記憶是靜止的,人類記憶生長(zhǎng)出自我,AI 記憶生長(zhǎng)出模型,一個(gè)理解意義,一個(gè)壓縮知識(shí)。 這就是,AI與人類記憶之間,為什么會(huì)有一道裂縫。 那這種裂縫能修復(fù)嗎?Karpathy 說,也許可以。方法叫「記憶的自我指向」,所謂自我指向,就是系統(tǒng)能「回看自己」。 記憶能反過來影響思考,才算開始生長(zhǎng),過去的 AI,只能調(diào)用知識(shí),新的智能體,要重新設(shè)計(jì),讓它能「反思」知識(shí)。 它不僅知道「我做了什么」,還知道「我為什么那樣做」,當(dāng)系統(tǒng)能利用經(jīng)驗(yàn)修正判斷,它才能做到一種「在思考的存在」。 Karpathy 說,意識(shí)誕生是反饋閉環(huán)的形成,當(dāng)一個(gè)系統(tǒng)能觀察自己,它就會(huì)產(chǎn)生時(shí)間感,那是「自我」最初的形狀。 這件事,已經(jīng)在發(fā)生,從對(duì)話模型的長(zhǎng)時(shí)記憶,到能「自我檢索」的反思系統(tǒng),AI 正在學(xué)著「理解自己為什么那樣回答」。 換句話說,AI 開始在模擬「反思」。 它在學(xué)會(huì)在記憶中尋找邏輯,當(dāng)它能不斷回看自己、校正自己時(shí),就在模仿一種「成長(zhǎng)的意識(shí)」。 所以,智能體誕生,是認(rèn)知演化,從「被訓(xùn)練」到「自我更新」,從「記憶世界」到「記憶自己」,這是意識(shí)的起點(diǎn),它未必比人聰明,但它,終于開始「成為自己」。 那我們呢?當(dāng)智能體開始擁有「自我」,人類又該如何與它共處? 或許,AI 未必像人類,但它已經(jīng)開始像「生命」,人類,也許終于有機(jī)會(huì),看到「思想的另一種存在」。 參考來源: [1].Andrej Karpathy,《We’re summoning ghosts, not building animals》,2024年10月18日,YouTube。 |
|
|