|
2017年10月,《自然》(Nature)雜志刊出了谷歌Deep Mind團(tuán)隊(duì)的新成果。他們推出的新一代圍棋人工智能程序阿爾法元(Alpha Go Zero)以100比0的絕對(duì)優(yōu)勢(shì)戰(zhàn)勝上一代人工智能圍棋程序阿爾法狗(Alpha Go)。關(guān)鍵是,阿爾法元是在沒有人類經(jīng)驗(yàn)指導(dǎo)的情況下,僅僅憑借圍棋基本規(guī)則和自我學(xué)習(xí)而獲得了高超的圍棋技能。這一勝績(jī)?cè)僖淮我鸸姷恼痼@和擔(dān)憂。人們擔(dān)憂的是,計(jì)算機(jī)可以不需要人類經(jīng)驗(yàn)作基礎(chǔ),卻遠(yuǎn)遠(yuǎn)高于人類學(xué)習(xí)的水平。這似乎在說(shuō),人類的智力已經(jīng)遠(yuǎn)遠(yuǎn)不敵計(jì)算機(jī)了。在計(jì)算機(jī)的智力飛速發(fā)展的情況下,人類的生存價(jià)值和活動(dòng)空間不可避免地會(huì)被這種“更聰明”的人工智能所侵占。目前我們?cè)庥龅氖聦?shí)真的是這樣的嗎?“阿爾法們”真的來(lái)?yè)屓祟惖哪汤伊藛幔?/p> 如何理解“阿爾法們”的勝利 從阿爾法狗到阿爾法元,計(jì)算機(jī)的圍棋技藝進(jìn)步神速。但是,這兩代阿爾法的勝利究竟意味著什么呢? 在新聞報(bào)道中,我們讀到這樣的敘述: Alpha Go Zero僅用一張神經(jīng)網(wǎng)絡(luò)、一臺(tái)機(jī)器和4個(gè)TPU,經(jīng)過(guò)自我對(duì)弈式的訓(xùn)練,在3天的時(shí)間里實(shí)現(xiàn)了近500萬(wàn)局自我對(duì)弈,便能夠超越人類并打敗之前的Alpha Go版本。谷歌Deep Mind團(tuán)隊(duì)總結(jié)道:Alpha Go Zero相比與Alpha Go 的更強(qiáng)大之處在于:“它再也不會(huì)受到人類經(jīng)驗(yàn)的限制,而是可以不斷向世界上最強(qiáng)的圍棋手——也就是它自己學(xué)習(xí)到非既定的能力。” 當(dāng)Alpha Go戰(zhàn)勝人類棋手時(shí),人們還可以這樣安慰自己:因?yàn)锳lpha Go是學(xué)習(xí)了大量人類棋手的實(shí)際對(duì)弈棋局而獲得了下棋的技能,它戰(zhàn)勝了某一個(gè)棋手其實(shí)意味著人類的整體知識(shí)和智能的積累戰(zhàn)勝了一個(gè)個(gè)別的人。所以,對(duì)棋手個(gè)人而言,敗給Alpha Go可以說(shuō)雖敗猶榮。但是這一次,Alpha Go Zero完全不從人類的經(jīng)驗(yàn)中學(xué)習(xí),而是僅僅依靠最初的幾條圍棋基本規(guī)則,通過(guò)自我對(duì)弈的方式自我訓(xùn)練,三天自我對(duì)弈500萬(wàn)盤(這個(gè)數(shù)字與上一代Alpha Go學(xué)習(xí)了海量棋局,并且自我對(duì)弈3000萬(wàn)盤,歷經(jīng)數(shù)月訓(xùn)練相比,可謂進(jìn)步神速)就取得斐然的成就。這很容易讓人做出這樣的解釋,上一代的Alpha Go不敵新一代的Alpha Go Zero,是因?yàn)閺娜祟愔悄苤袑W(xué)習(xí)的Alpha Go敗給了師從純粹人工智能的Alpha Go Zero,人類的知識(shí)或智能限制了Alpha Go的學(xué)習(xí),而在拋棄了人類的經(jīng)驗(yàn)制約以后,計(jì)算機(jī)的智能可能遠(yuǎn)遠(yuǎn)把人類拋在后面。也就是說(shuō),這是人類智能對(duì)人工智能的失敗。 面對(duì)這樣的擔(dān)憂,人類比以往更加需要確證自己的存在價(jià)值。這種確證開始于對(duì)“智能”的理解。于是,我們不禁要追問(wèn):人工智能的“智能”的真正含義是什么呢? 首先,人工智能在根本上是“計(jì)算機(jī)”。因此,它們?cè)谟?jì)算任務(wù)上超過(guò)人類并不應(yīng)是一件需要擔(dān)憂的事件,而應(yīng)是值得高興的事件。正如人類制造了汽車——可以被稱為“移動(dòng)機(jī)”。當(dāng)汽車的移動(dòng)速度遠(yuǎn)遠(yuǎn)超過(guò)人的極限時(shí),并沒有人為此擔(dān)憂人類移動(dòng)能力的價(jià)值受到了威脅。計(jì)算機(jī)最初被發(fā)明出來(lái),是為了讓它幫人處理“按照既定規(guī)則進(jìn)行計(jì)算”的任務(wù)。計(jì)算機(jī)在計(jì)算任務(wù)上超越人類,正像汽車的移動(dòng)能力超越人類一樣,它們所體現(xiàn)出來(lái)的“優(yōu)勢(shì)”不正是由人類智能所“創(chuàng)造”的嗎? 其次,對(duì)弈是人類發(fā)明的一種智力游戲。這類游戲的共同特征是有明確的規(guī)則和清晰的邊界,并且對(duì)游戲的最后成果有精確的衡量指標(biāo)。對(duì)弈雙方必須在規(guī)則和邊界的限制下,通過(guò)合理性計(jì)算而實(shí)現(xiàn)“贏棋”的目標(biāo)。這樣的活動(dòng)是“結(jié)構(gòu)良好任務(wù)”。針對(duì)結(jié)構(gòu)良好任務(wù),解決辦法是按照既有的規(guī)則“計(jì)算”盡可能多的中間狀態(tài),并對(duì)每一種中間狀態(tài)的效價(jià)進(jìn)行評(píng)估,并選擇最佳的路徑。對(duì)弈者能夠評(píng)估的中間狀態(tài)越多,贏棋的可能性就越大。但是這種評(píng)估顯然受到計(jì)算能力的限制。我們把計(jì)算過(guò)程中的中間狀態(tài)的總和稱為“問(wèn)題空間”,那么初始規(guī)則越少,問(wèn)題空間就越大。在人類的棋類游戲中,圍棋是初始規(guī)則最簡(jiǎn)單、棋盤格子最多的一種,所以,圍棋對(duì)弈計(jì)算的問(wèn)題空間非常巨大。在Alpha Go誕生之前,有很多人相信計(jì)算機(jī)的計(jì)算能力無(wú)法處理圍棋的問(wèn)題空間。谷歌的研究團(tuán)隊(duì)在計(jì)算方式上的革新讓計(jì)算機(jī)的計(jì)算能力有了長(zhǎng)足的進(jìn)步,所以才有了戰(zhàn)勝人類棋手的成績(jī)。但是我們也應(yīng)該看到Alpha Go和新一代的Alpha Go Zero所處理的都是“結(jié)構(gòu)良好問(wèn)題”。解決結(jié)構(gòu)良好問(wèn)題的關(guān)鍵是計(jì)算能力,所以,兩代Alpha Go的成就其實(shí)是基于計(jì)算能力的提升。那么,計(jì)算能力能不能等同于人類的“智能”呢? 通過(guò)“反轉(zhuǎn)圖靈測(cè)試”理解人的智慧價(jià)值 要比較人工智能和人類的“智能”的異同或高下,我們需要對(duì)人類的“智能”做出界定。但是人的智能究竟意味著什么,這個(gè)問(wèn)題至今尚未有定論。在這里,我們可以嘗試著通過(guò)“反轉(zhuǎn)圖靈測(cè)試”的思維實(shí)驗(yàn)來(lái)厘清人類“心智”或“智能”的一些重要特征。 “圖靈測(cè)試”是圖靈在提出人工智能的基礎(chǔ)模型時(shí)為鑒定人工智能的“智能”水平而設(shè)計(jì)的一種評(píng)價(jià)標(biāo)準(zhǔn)。如果一個(gè)計(jì)算機(jī)程序可以在限定的范圍內(nèi)讓測(cè)試者不能分辨是計(jì)算機(jī)還是人類,那么我們就可以說(shuō)這個(gè)計(jì)算機(jī)程序具有了和人類一樣的“智能”。“圖靈測(cè)試”作為一個(gè)標(biāo)準(zhǔn),一直在指引著人工智能的設(shè)計(jì)理念,即努力讓計(jì)算機(jī)的表現(xiàn)更像人??梢钥闯觯皥D靈測(cè)試”實(shí)際上基于一個(gè)潛在的預(yù)設(shè),即人類的智能應(yīng)該或可能是什么樣的,并且以此指引著計(jì)算機(jī)朝著這個(gè)假設(shè)發(fā)展。但是,人的智能實(shí)際上具有什么特征,其實(shí)我們至今是不清楚的。于是,我們不妨把圖靈測(cè)試顛倒過(guò)來(lái),讓人去模仿計(jì)算機(jī),也就是以我們能夠清晰認(rèn)識(shí)的東西作為參照,反過(guò)來(lái)觀照人類智能的意義。假如我們讓一個(gè)人去模擬一臺(tái)計(jì)算機(jī),那么測(cè)試者將如何識(shí)別呢?這就是“反轉(zhuǎn)圖靈測(cè)試”。為了辨別對(duì)方是真實(shí)的人或是計(jì)算機(jī),測(cè)試者只需要讓他(或它)在有限時(shí)間內(nèi)完成大量的計(jì)算任務(wù)。這是計(jì)算機(jī)可以輕易完成而人絕對(duì)難以做到的。通過(guò)這個(gè)思維實(shí)驗(yàn),我們發(fā)現(xiàn),人類和計(jì)算機(jī)的差異正是在于計(jì)算能力的差異。這樣看來(lái),我們不難理解,弈棋任務(wù)作為結(jié)構(gòu)良好問(wèn)題,其核心在于對(duì)問(wèn)題空間的計(jì)算,因此,在這類任務(wù)中人不敵計(jì)算機(jī)是理所當(dāng)然的。關(guān)鍵是,人類以有限的計(jì)算能力卻能夠創(chuàng)造出如此豐富的知識(shí)和技能,這說(shuō)明,計(jì)算能力并不是做出這些成績(jī)的唯一基礎(chǔ);此外,除了不那么強(qiáng)大的計(jì)算能力——和計(jì)算機(jī)相比,人類一定還擁有其他更強(qiáng)大的能力。 從知識(shí)論的角度看,人類的知識(shí)建構(gòu)有兩條途徑,一種是自上而下的演繹,另一種是自下而上的歸納。演繹是依據(jù)既定的論證規(guī)則而實(shí)現(xiàn)知識(shí)的精致化加工;歸納則是從經(jīng)驗(yàn)中形成一般化的認(rèn)識(shí)。關(guān)于演繹,人類已經(jīng)形成了相對(duì)完備的規(guī)則,即邏輯規(guī)則。正是在已有的形式化邏輯規(guī)則的指導(dǎo)下,計(jì)算機(jī)才可能完成各種“思維”活動(dòng)。然而,關(guān)于歸納則始終沒有統(tǒng)一有效的“歸納邏輯”。計(jì)算機(jī)的“歸納學(xué)習(xí)”也是通過(guò)大量嘗試性練習(xí)而形成的一種概率評(píng)估,比如貝葉斯計(jì)算。我們知道,人和動(dòng)物的天然傾向顯然不是通過(guò)概率計(jì)算來(lái)進(jìn)行歸納推理的,也就是說(shuō),歸納不是一個(gè)計(jì)算過(guò)程。于是,我們可以將演繹和歸納分別對(duì)應(yīng)于“可計(jì)算”的任務(wù)和“不可計(jì)算”的任務(wù)。 顯然,計(jì)算機(jī)被制造出來(lái)就是讓它幫助人類應(yīng)對(duì)“可計(jì)算”任務(wù)。計(jì)算機(jī)科學(xué)家讓今天的計(jì)算機(jī)能夠出色地完成這一類任務(wù),而這正是作為制造者的人類的“智能”的成就。計(jì)算機(jī)在“可計(jì)算”任務(wù)中的表現(xiàn)超越了人類,但是人類依然在“不可計(jì)算”任務(wù)中保持自己的優(yōu)勢(shì)。哪些事情屬于“不可計(jì)算”任務(wù)呢?諸如:真正的創(chuàng)造性問(wèn)題,結(jié)論超出了前提閾界的問(wèn)題等。新聞報(bào)道說(shuō)Alpha Go Zero僅僅依靠幾條圍棋的初始規(guī)則就“實(shí)現(xiàn)了從0到1的轉(zhuǎn)變”等。實(shí)際上,Alpha Go Zero所做的事情和歐幾里德從幾條公理出發(fā),演繹出數(shù)百條幾何定律一樣,是通過(guò)演繹途徑對(duì)初始規(guī)則的分析,從而實(shí)現(xiàn)知識(shí)的精致化演變。這樣的推衍固然顯示了演繹推理的創(chuàng)造力,而真正創(chuàng)造性地“從0到1”的轉(zhuǎn)變卻是“發(fā)明”圍棋的人提出圍棋初始規(guī)則的那一步。 假如,我們只是給計(jì)算機(jī)一把棋子,沒有任何規(guī)則,也沒有任何要求,那么,它會(huì)計(jì)算出什么樣的結(jié)果呢?它會(huì)不會(huì)突然停下正在執(zhí)行的任務(wù),“看著”這些棋子發(fā)呆,并開始在“地上”畫出一些格子,并想象出一些規(guī)則,然后開始“玩”一種叫做“棋”的游戲呢?如果真的有一天計(jì)算機(jī)能夠自己“生成”一系列規(guī)則,發(fā)明了圍棋、象棋之類的游戲,那才是人類應(yīng)該擔(dān)憂的情況。 (作者單位:西南民族大學(xué)社會(huì)學(xué)與心理學(xué)學(xué)院) 原標(biāo)題:阿爾法元?jiǎng)恿苏l(shuí)的奶酪 |
|
|