|
機(jī)器能否擁有像人類一樣的意識(shí)?要回答這個(gè)問題,首先要探索人類意識(shí)是如何產(chǎn)生和存在的。在2017年10月 Science 神經(jīng)科學(xué)特刊的一篇綜述中,研究者回顧了三個(gè)級(jí)別的人類意識(shí):C0 無意識(shí)的“自動(dòng)駕駛模式”,C1 獲取信息作出決策,C2 元認(rèn)知。機(jī)器能否達(dá)到這三種意識(shí)水平?人類意識(shí)模式對(duì)構(gòu)建人工智能有何啟發(fā)?請(qǐng)看這篇長文綜述。
主要內(nèi)容:
摘要 關(guān)于機(jī)器是否擁有意識(shí),這類具有爭議性的問題,必須基于對(duì)意識(shí)是如何在唯一的物理系統(tǒng)中產(chǎn)生進(jìn)行認(rèn)真思考 -- 毫無疑問,人類的大腦擁有意識(shí)。 因此, 我們建議將“意識(shí)”這個(gè)詞在大腦中合并成兩種不同類型的信息加工進(jìn)行計(jì)算:為總體傳播選擇信息,從而使其靈活地用于計(jì)算和報(bào)告(C1,第一感覺上的意識(shí)),以及有關(guān)自我監(jiān)控的計(jì)算,會(huì)導(dǎo)致一種主觀上的確定感或錯(cuò)誤(C2,第二感覺上的意識(shí))。我們認(rèn)為,盡管, 有關(guān)這方面的研究在最近曾取得了成功,但是, 目前的機(jī)器主要實(shí)施的計(jì)算,仍然反映的是人腦的無意識(shí)加工過程(C0)。為此, 我們主要回顧了心理學(xué)和神經(jīng)科學(xué)中的無意識(shí)計(jì)算(C0)和有意識(shí)計(jì)算(C1和C2),并概述它們是如何激發(fā)新型的機(jī)器架構(gòu)。 意識(shí)的三個(gè)維度:
我們可以想象,當(dāng)你正在開車時(shí),突然看到燃油指示燈亮起來了。那么, 這是一個(gè)什么樣的,復(fù)雜的神經(jīng)元聚合,讓你意識(shí)到指示燈的閃動(dòng)?而且, 又是什么讓這輛汽車,一個(gè)復(fù)雜的電子和工程產(chǎn)品,沒有意識(shí)到這一閃光的警示?這輛汽車會(huì)被賦予與我們相似的意識(shí)嗎?這些問題都能得到科學(xué)地解決嗎? 現(xiàn)代計(jì)算科學(xué)的創(chuàng)始人艾倫·圖靈(Alan Turing)和約翰·馮·諾依曼(John von Neumann)認(rèn)為, 機(jī)器最終會(huì)模仿包括意識(shí)在內(nèi)的大腦的所有能力。人工智能(AI)的最新進(jìn)展已使這一目標(biāo)得以實(shí)現(xiàn)。在神經(jīng)生物學(xué)的啟發(fā)下,機(jī)器學(xué)習(xí)的改進(jìn)導(dǎo)致人工神經(jīng)網(wǎng)絡(luò)接近或偶爾超越了人類(1,2)。盡管,這些網(wǎng)絡(luò)并不能模仿人類大腦實(shí)際的生物物理特性,但是, 它們的設(shè)計(jì)受益于幾個(gè)神經(jīng)生物學(xué)的見解,包括非線性輸入輸出函數(shù),具有收斂投射功能的層面和可修改的突觸權(quán)重(modifiable synaptic weights)?,F(xiàn)在, 計(jì)算機(jī)硬件和訓(xùn)練算法的進(jìn)展使得這類網(wǎng)絡(luò)能夠?qū)?fù)雜的問題(如機(jī)器翻譯)進(jìn)行操作,所獲得的成功率, 以前則被認(rèn)為是一個(gè)真正的大腦的特權(quán)。那么,機(jī)器是否處在意識(shí)的邊緣呢? 我們認(rèn)為, 答案是否定的:當(dāng)前的深度學(xué)習(xí)網(wǎng)絡(luò)所實(shí)現(xiàn)的計(jì)算主要是與人腦中的無意識(shí)操作相對(duì)應(yīng)。然而,就像人工神經(jīng)網(wǎng)絡(luò)從神經(jīng)生物學(xué)中獲得靈感一樣,人工意識(shí)可能會(huì)通過研究人類大腦產(chǎn)生意識(shí)的架構(gòu)而獲得進(jìn)展,然后,再將這些深刻理解轉(zhuǎn)化為計(jì)算機(jī)算法。我們的目的是, 通過回顧可能與機(jī)器相關(guān)的, 認(rèn)知神經(jīng)科學(xué)中意識(shí)的各個(gè)方面來促進(jìn)這種進(jìn)步。 一、意識(shí)的多重意義 意識(shí)這個(gè)詞,像許多近代科學(xué)以前的術(shù)語一樣,被廣泛賦予不同的意義。在醫(yī)學(xué)方面,它通常指一種非傳遞性的感覺,被用于評(píng)估警覺和清醒度的狀態(tài),(如“患者沒有意識(shí)了”),以充分闡明大腦的警覺機(jī)制是一個(gè)基本的科學(xué)目標(biāo),對(duì)于我們理解睡眠,麻醉,昏迷或植物人狀態(tài)等均有重要的影響。由于缺乏篇幅空間,我們?cè)谶@里就不涉及到這一方面,它對(duì)計(jì)算的影響似乎也很小:顯然,一臺(tái)機(jī)器必須恰當(dāng)?shù)貑?dòng)才能正常地運(yùn)行和計(jì)算。 我們認(rèn)為,區(qū)分意識(shí)計(jì)算的其他兩個(gè)基本維度是非常有用的。為此,我們使用總體可用性(C1)和自我監(jiān)控(C2)這樣兩個(gè)術(shù)語來標(biāo)記它們。
C1: 總體可用性 Global availability 這一術(shù)語主要是對(duì)應(yīng)于意識(shí)的傳遞意義(如同“司機(jī)意識(shí)到閃光”)。它指的是,認(rèn)知系統(tǒng)與特定的思想對(duì)象之間的關(guān)系,如“油箱指示燈”的心理表征。這一對(duì)象似乎被選中要做進(jìn)一步處理,包括語言和非語言報(bào)告。有意識(shí)的信息就是在這一意義上成為有機(jī)體的總體可用性; 例如,我們可以回想它,并對(duì)它采取行動(dòng),還可以談?wù)撍_@一感覺與“記住這一信息”具有相同的意義。在一個(gè)既定的時(shí)間內(nèi),將有關(guān)思維的,大量的計(jì)算機(jī)指令變?yōu)橐庾R(shí),只有具有總體可用性的信息才能構(gòu)成了C1意識(shí)中的內(nèi)容。 C2: 自我監(jiān)控 Self-monitoring 意識(shí)的另一個(gè)意義是具有反射性。它指的是,認(rèn)知系統(tǒng)中的一種自我指涉關(guān)系(a self-referential relationship),這種關(guān)系能夠監(jiān)控自己的加工, 并獲得有關(guān)自身的信息。人類對(duì)自身已經(jīng)了解了很多,包括諸如身體各器官的布局和位置,他們是否能知道或感知某事,抑或他們是否只是犯了一個(gè)錯(cuò)誤等各種各樣的信息。這種意識(shí)通常是與所說的內(nèi)省introspection相對(duì)應(yīng),也就是心理學(xué)家所說的“元認(rèn)知”(“meta-cognition”)–即對(duì)自己的知識(shí)和才能進(jìn)行內(nèi)在表征的能力。 我們提出,C1和C2構(gòu)成了有意識(shí)計(jì)算的正交維度(orthogonal dimensions)。這并不是說,C1和C2均不涉及重疊的體能基質(zhì),事實(shí)上,正如我們以下所述,人類的大腦都依賴于前額葉皮質(zhì)。但是,我們還認(rèn)為,在經(jīng)驗(yàn)和概念上,這兩者可能也會(huì)分開,因?yàn)椋跊]有C2的情況下,還可以有C1,例如,在可報(bào)告加工時(shí)并沒有伴隨著準(zhǔn)確的元認(rèn)知;而沒有C1的C2, 則是指,在自我監(jiān)控操作展開時(shí),卻沒有被有意識(shí)地報(bào)告。 因此,我們?cè)诳紤]它們的協(xié)同作用之前,就分別考慮這些計(jì)算是有益的。此外,還有許多計(jì)算既不涉及C1,也不涉及C2,因此,被恰當(dāng)?shù)胤Q之為“無意識(shí)”(簡稱為C0)。這是圖靈的獨(dú)到見解,即使是復(fù)雜的信息加工也可以通過無頭腦的自動(dòng)機(jī)來實(shí)現(xiàn)。認(rèn)知神經(jīng)科學(xué)已經(jīng)證實(shí),那些復(fù)雜計(jì)算,諸如人臉識(shí)別或語音識(shí)別,棋類游戲評(píng)估,語句解析和意義提取等,都可以在人類大腦中無意識(shí)地發(fā)生,而上述條件既不具有總體可用性,也不具備自我監(jiān)控(表1)。 在某種程度上,大腦似乎是將專門的處理器或“模塊”并列起來操作,并且我們還認(rèn)為,這與當(dāng)前的前饋控制深度學(xué)習(xí)網(wǎng)絡(luò)(feedforward deep-learningnetworks)的操作密切對(duì)應(yīng)。接下來,讓我們回顧一下人類和動(dòng)物的大腦是如何加工C0,C1和C2水平計(jì)算的實(shí)驗(yàn)證據(jù),然后再回到機(jī)器上,看它們是如何從對(duì)人類大腦結(jié)構(gòu)的理解而獲益。 無意識(shí)加工(C0): 大部分智能都是無意識(shí)的 “我們不能察覺我們意識(shí)不到的事物”(3),這一真理具有深遠(yuǎn)的影響。因?yàn)椋覀儗?duì)自身無意識(shí)的過程還是不了解的,所以,我們傾向于低估自己在心靈生活中的角色。盡管,認(rèn)知神經(jīng)科學(xué)家們開發(fā)了各種呈現(xiàn)圖像或聲音的方法和手段,但是,依然沒有給我們帶來任何有意識(shí)的體驗(yàn)(圖1),后來,這些科學(xué)家又使用行為和大腦成像來探測(cè)其加工深度。 圖1探索無意識(shí)加工(C0)的實(shí)例 (上圖)潛意識(shí)視圖-不變的人臉識(shí)別(77)。在每一次試驗(yàn)中,都短暫地呈現(xiàn)一個(gè)被面罩遮住的主要面孔(50毫秒),隨后是可見的目標(biāo)面孔(500毫秒)。盡管,主觀感知在不同條件下是相同的,但是,無論何時(shí),這兩張面孔都代表同一個(gè)人,在相同或不同的視圖中,加工都得到促進(jìn)。在行為層面,它體現(xiàn)出,這種視圖不變的無意識(shí)啟動(dòng)在識(shí)別目標(biāo)人臉時(shí)的反應(yīng)時(shí)有所減少。而在神經(jīng)層面,它則體現(xiàn)出,在人的下顳葉皮質(zhì)中的紡錘臉面部區(qū)域,對(duì)目標(biāo)人臉的皮質(zhì)反應(yīng)有所減少(重復(fù)抑制)。 (下圖)有關(guān)雙眼抑制期間,證據(jù)的潛意識(shí)積累(16)。在一只眼睛中所呈現(xiàn)的突出移動(dòng)點(diǎn)可以防止,在相反的眼睛中灰白的移動(dòng)點(diǎn)變成有意識(shí)的感知。盡管,它們是看不見的,但當(dāng)它們向同一方向移動(dòng)時(shí),灰色圓點(diǎn)就會(huì)促進(jìn)性能,作為隨后的圓點(diǎn)顯示,這是一種與其連貫性的移動(dòng)量相稱的效果。這種促進(jìn)只影響一個(gè)一級(jí)任務(wù)(判斷運(yùn)動(dòng)的方向),而不是二級(jí)元認(rèn)知判斷(評(píng)估第一個(gè)反應(yīng)的信心)。一個(gè)證據(jù)積累的計(jì)算模型提出要將潛意識(shí)運(yùn)動(dòng)信息添加到有意識(shí)的信息中,從而導(dǎo)致決策的偏置和縮短。 總之, 啟動(dòng)現(xiàn)象說明了無意識(shí)加工的顯著深度。一個(gè)高度可見的目標(biāo)刺激, 諸如書面語“4”, 可先與一個(gè)相關(guān)的主要刺激,阿拉伯?dāng)?shù)字“4”之前, 進(jìn)行更有效的加工,哪怕受試者沒有注意到一個(gè)主要刺激的存在,也不能可靠地報(bào)告其身份。潛意識(shí)的數(shù)字,話語,人臉或物體可被不變地識(shí)別,并影響運(yùn)動(dòng),語義和決策水平的加工(表1)。神經(jīng)成像方法顯示,絕大多數(shù)的大腦區(qū)域可以被無意識(shí)地激活。 人類大腦中無意識(shí)的 視圖不變性和意義提取 Unconscious view-invariance and meaning extraction in the human brain 最近,人工智能提出許多難度很大的感知計(jì)算(perceptual computations),如不變的人臉識(shí)別或說話者不變的語音識(shí)別,以對(duì)應(yīng)于人腦中的非意識(shí)計(jì)算(nonconscious computations)(4-6)。例如,在對(duì)同一個(gè)人完全不同的觀點(diǎn)進(jìn)行潛意識(shí)描述之前,加工該人的臉就比較容易,以表明無意識(shí)的不變識(shí)別(圖1)。潛意識(shí)啟動(dòng)(Subliminal priming)概括了這種跨視聽形式(7,8),從而揭示了人工智能軟件(例如,語義向量提取或語音文本)仍然具有挑戰(zhàn)性的交叉知覺模式, 同時(shí),也涉及到無意識(shí)機(jī)制。甚至,感覺輸入的語義意義也可以在沒有人腦意識(shí)的情況下進(jìn)行加工。與相關(guān)詞語(例如, 動(dòng)物-狗)相比較,語義違規(guī)(semantic violations)(例如,家具-狗)在顳葉語言網(wǎng)絡(luò)中的刺激開始發(fā)生的400毫秒后,即產(chǎn)生大腦反應(yīng),即使,兩個(gè)單詞中的一個(gè)不能被有意識(shí)地檢測(cè)到(9, 10)。 無意識(shí)的控制和決策 Unconscious control and decision-making 潛意識(shí)過程可以達(dá)到更深的皮質(zhì)層次。例如,閾下啟動(dòng)(subliminal primes)可以影響任務(wù)選擇(11)或運(yùn)動(dòng)反應(yīng)抑制中(12)所涉及的認(rèn)知控制前額機(jī)制。決策的神經(jīng)機(jī)制則包括累積感覺證據(jù),以影響各種選擇的概率,直到達(dá)到閾值。這種概率性知識(shí)的積累, 即使在潛意識(shí)刺激下也會(huì)持續(xù)發(fā)生(13-16)。貝葉斯推理和證據(jù)累積,是人工智能(2)的基礎(chǔ)計(jì)算,也是人類基本的無意識(shí)機(jī)制。 無意識(shí)學(xué)習(xí) Unconscious learning 強(qiáng)化學(xué)習(xí)算法(Reinforcement learning algorithms)主要是基于以往的獎(jiǎng)勵(lì)歷史, 捕獲人類和動(dòng)物是如何塑造其未來行為,尤其是在玩Go游戲(1)等幾個(gè)應(yīng)用程序中已獲得了超人類的人工智能性能。值得注意的是,對(duì)于人類而言,即使有關(guān)線索,獎(jiǎng)勵(lì)或動(dòng)機(jī)信號(hào)低于意識(shí)閾值(17,18),這種學(xué)習(xí)似乎也會(huì)繼續(xù)進(jìn)行。 復(fù)雜的無意識(shí)計(jì)算和推斷,通常是在各種大腦區(qū)域內(nèi)并行發(fā)生?,F(xiàn)在, 許多這樣的C0計(jì)算已經(jīng)被人工智能捕獲,特別是通過使用前饋卷積神經(jīng)網(wǎng)絡(luò)(CNN)。接下來,我們考慮的是,有關(guān)有意識(shí)加工所需要的附加計(jì)算。 C1: 總體可用性的相關(guān)信息 對(duì)集成和協(xié)調(diào)的需求 The need for integration and coordination 將大腦組織成專業(yè)的計(jì)算子系統(tǒng)是卓有成效的,但是, 這種架構(gòu)也提出了一個(gè)具體的計(jì)算問題:即整個(gè)有機(jī)體不能一直堅(jiān)守多元化的概率解釋; 它必須有所行動(dòng),從而切斷了多重可能性,并決定采取單一的行動(dòng)方式。要將所有可獲得的證據(jù)都集成到一個(gè)單一的決策中是一種計(jì)算要求,我們認(rèn)為,如此必須面對(duì)任何動(dòng)物或自主的人工智能系統(tǒng),以符合我們給意識(shí)所下的第一個(gè)功能定義:總體可用性(C1)。 例如,大象在口渴的時(shí)候,總要設(shè)法確定離其最近一個(gè)水源的位置,并從5到50公里(19)這樣的距離直接移動(dòng)。這樣的決策需要一個(gè)復(fù)雜的架構(gòu)(i),以更有效地匯集所有可用的信息資源,包括多種感覺器官和記憶線索; (ii)并考慮到這些可用的選項(xiàng),然后基于這個(gè)大型信息庫, 最后做出最佳的選擇; (iii)同時(shí), 隨著時(shí)間的推移; (iv)來協(xié)調(diào)所有內(nèi)部和外部流程,以實(shí)現(xiàn)其目標(biāo)。 原始生物(primitive organisms),諸如細(xì)菌,可能只是通過不協(xié)調(diào)的感覺運(yùn)動(dòng)系統(tǒng)中的,無意識(shí)的競爭來實(shí)現(xiàn)這種決策。然而,這種解決方案一旦跨越暫時(shí)的延遲,并抑制短期傾向,支持長期的制勝策略,就會(huì)失敗。因此,那種連貫一致的,經(jīng)過深思熟慮的計(jì)劃就需要一種特定的C1架構(gòu)。 進(jìn)入內(nèi)部總體工作空間的意識(shí) Consciousness as access to an internal global workspace 我們假設(shè),第一感覺意義中的意識(shí)(C1)可演變成為一種解決信息共享問題的信息處理架構(gòu)(20-23)。在這一觀點(diǎn)中,C1的架構(gòu)逐步打破了無意識(shí)計(jì)算的模塊化和并行性。在專業(yè)模塊的深層次上,一個(gè)容量有限的“總體神經(jīng)元工作空間”演變成為選擇一段信息,然后,隨著時(shí)間推移,在跨模塊間實(shí)行分享。我們將此稱之為“有意識(shí)”,在一個(gè)給定的時(shí)間內(nèi),無論如何,它都能贏得進(jìn)入這一精神競技場(chǎng)的競爭,并被選擇為總體共享和決策。可見,意識(shí)主要表現(xiàn)為,一種念頭或一系列念頭對(duì)心理過程的短暫支配,以便引導(dǎo)各種各樣的行為。這些行為不僅包括身體動(dòng)作,還包括心理活動(dòng),例如,提交信息給情景記憶(episodic memory),或按照指定路線將其發(fā)送給其它處理器。 意識(shí)與注意力之間的關(guān)系 Relation between consciousness and attention 威廉·詹姆斯(William James)曾將注意力形容為“一種以清晰而生動(dòng)的形式從心靈上占有似乎同時(shí)可能存在的幾個(gè)對(duì)象或一連串的思想或思路”(24)。這一定義已很接近于我們所說的C1含義:是對(duì)進(jìn)入總體工作空間的單一信息的選擇。然而,在最后的步驟,也就是有意識(shí)的進(jìn)入和前注意選擇階段之間有一個(gè)明確的區(qū)別,即在這個(gè)階段可以無意識(shí)地進(jìn)行操作。 許多實(shí)驗(yàn)已經(jīng)確認(rèn),專用的注意力定向機(jī)制的存在,并表明,像其他任何處理器一樣,它們可以無意識(shí)地操作:(i)從自上而下的方向,注意力可以面向?qū)ο?,增?qiáng)對(duì)其的加工,但卻不能使它進(jìn)入意識(shí)(25); (ii) 從自下而上的方向,即使這種刺激最終保持無意識(shí),注意力也能被閃光所吸引(26)。所以,我們所稱之的注意力,是一個(gè)被無意識(shí)操作的分級(jí)篩選系統(tǒng)。 在能力有限的系統(tǒng)中 全有或全無選擇的證據(jù) Evidence for all-or-none selection in a capacity-limited system 靈長類動(dòng)物的大腦都包含一個(gè)有意識(shí)的瓶頸,只能在一次有意識(shí)地進(jìn)入一個(gè)單一的項(xiàng)目(表1)。例如,相互競爭的圖片或模棱兩可的話語被以全有或全無的方式感知著; 在任何給定的時(shí)間內(nèi),我們?cè)谥饔^上,只能從許多可能的解釋中感知到一個(gè)單一的解釋, [即使其它的解釋,仍在被無意識(shí)地加工(31,32)]。 集成和發(fā)送的證據(jù) Evidence for integration and broadcasting 人類的大腦成像和猴子的神經(jīng)元記錄表明,意識(shí)的瓶頸是由分布在大腦皮層的神經(jīng)元網(wǎng)絡(luò)所造成的,但是, 更著重強(qiáng)調(diào)高級(jí)的聯(lián)想?yún)^(qū)域。表1中所列出的是一些已通過使用各種腦部成像技術(shù),在有意識(shí)感知期間已經(jīng)證實(shí)的全有或全無的網(wǎng)絡(luò)“觸燃點(diǎn)”。單細(xì)胞記錄還表明,每一個(gè)特定的意識(shí)知覺,如一個(gè)人的臉,都是由一組神經(jīng)元以全有或全無的形式從高水平的顳葉和前額皮質(zhì)所發(fā)出,而其它神經(jīng)元?jiǎng)t保持沉默(圖2)(31,32,37,38)。 圖2總體可用性:第一感覺意義上的意識(shí)(C1)。 有意識(shí)的主觀感知是被編碼在相互連接的高水平大腦皮質(zhì)區(qū)域(包括外側(cè)前額葉皮質(zhì),顳葉前皮層和海馬體),并為分布在該區(qū)域的特定神經(jīng)刺激群所突然激活。 (上圖)在雙眼閃光抑制過程中,一張圖片對(duì)一只眼睛的閃動(dòng)會(huì)抑制第二張圖片對(duì)另一只眼睛所呈現(xiàn)的,有意識(shí)的感知。因此,相同的物理刺激會(huì)導(dǎo)致不同的主觀感受。這個(gè)例子說明,一個(gè)對(duì)人臉敏感的前額神經(jīng)元,對(duì)跳棋則沒有反應(yīng),這種激活的噴出與突然爆發(fā)的主觀面孔感知密切相關(guān)(31)。 (下圖)在遮蔽過程中,一個(gè)閃現(xiàn)的圖像,如果時(shí)間很短,再戴上一個(gè)長“面具”,則可以在主觀上保持隱形。如圖所示,內(nèi)嗅皮層中的神經(jīng)元,有選擇地向“世界貿(mào)易中心”這一概念實(shí)施激活。紅色的掃描光柵(Rasters)表示,受試者報(bào)告,對(duì)試驗(yàn)圖片正在識(shí)別(藍(lán)色掃描光柵則表示,對(duì)圖片沒有識(shí)別)。在遮蔽下,圖片只能被呈現(xiàn)33毫秒,此時(shí),已很少或基本沒有神經(jīng)活動(dòng); 但是,一旦呈現(xiàn)時(shí)間比感知閾值(66毫秒或更多)更長,神經(jīng)元就會(huì)在被識(shí)別的嘗試中大幅激活??偟膩碚f,即使針對(duì)相同的目標(biāo)輸入(相同的持續(xù)時(shí)間),峰值活動(dòng)對(duì)于那些識(shí)別嘗試也會(huì)越來越高,越來越穩(wěn)定(38)。 穩(wěn)定性是意識(shí)的特征 Stability as a feature of consciousness 通過直接對(duì)比,看見的和看不見的圖片或文字, 我們得以證實(shí),這種觸發(fā)只發(fā)生在有意識(shí)的知覺上。正如前面所解釋的那樣,無意識(shí)刺激可能會(huì)進(jìn)入深層的皮層網(wǎng)絡(luò),并影響到更高層次的加工甚至是中樞執(zhí)行系統(tǒng),但是, 這些效應(yīng)往往是較小的,且易變的和短暫存在, [盡管, 無意識(shí)信息的衰減速度比最初的預(yù)期要慢許多(39,40]。相比之下,穩(wěn)定的,可再生的高質(zhì)量信息在更高級(jí)的大腦皮質(zhì)區(qū), 通過一個(gè)分布式活動(dòng)模式顯示出有意識(shí)的加工特征(表1)。對(duì)于神經(jīng)系統(tǒng)來說,這種短暫的“元穩(wěn)定性”(“meta-stability”)似乎需要整合來自各模塊的信息,然后再將其發(fā)送出來,從而實(shí)現(xiàn)靈活的跨模塊路徑。 人類和非人類動(dòng)物中的C1意識(shí) C1 consciousness in human and nonhuman animals C1意識(shí)是存在于人類嬰兒(41)和動(dòng)物中的一種基本屬性。非人靈長類動(dòng)物也曾表現(xiàn)出相似的視錯(cuò)覺(31,32),包括注意力眨眼(42)以及如同人類被試者的中樞容量極限(43)。對(duì)于人類和非人類靈長類動(dòng)物而言,前額葉皮質(zhì)(prefrontal cortex)似乎都做為一種中樞信息共享裝置和串行瓶頸[43]??梢?,前額葉皮質(zhì)在人類譜系中的顯著擴(kuò)張可能會(huì)導(dǎo)致更大的多模式收斂和集成能力(44-46)。此外,人類的下前額葉皮質(zhì)還擁有額外的電路,用于口頭表示和向其他人報(bào)告信息。 通過語言來報(bào)告信息的能力被普遍認(rèn)為是,意識(shí)感知最明顯的標(biāo)志之一,因?yàn)?,一旦信息達(dá)到了人類的這種代表性水平,就必然可以在各心理模塊間共享,因此,C1感覺是有意識(shí)的。雖然, 語言不需要有意識(shí)的感知和加工,但是, 人類語言電路的出現(xiàn)可能會(huì)導(dǎo)致C1水平信息共享的速度,便捷性和靈活性的顯著提高。 C2:自我監(jiān)控 鑒于C1意識(shí)反映了其具有訪問外部信息的能力,而第二感覺意義上的意識(shí)(C2)則以具有條件反射性地自我表現(xiàn)能力為特征(47-50)。有關(guān)認(rèn)知神經(jīng)科學(xué)和心理學(xué)方面的大量研究已經(jīng)在“元認(rèn)知”(meta cognition)的術(shù)語下提出了自我監(jiān)控的概念,這一概念被粗略地定義為: 對(duì)認(rèn)知的認(rèn)知或?qū)φJ(rèn)識(shí)的認(rèn)識(shí)(cognition about cognition or knowing about knowing)。下面,讓我們回顧一下, 靈長類動(dòng)物大腦自身的監(jiān)控機(jī)制,并側(cè)重它們構(gòu)建自我反射機(jī)器的啟示。 信心的概率感 A probabilistic sense of confidence 每當(dāng)做決定的時(shí)候, 人類對(duì)自己的選擇或多或少都感到一定的自信。信心可以被定義為,是對(duì)一個(gè)決定或計(jì)算是否正確的概率感(51)。人的大腦幾乎在任何時(shí)候都能感知或做出決定,它還能評(píng)估可信度。另外,學(xué)習(xí)也伴隨著一種可量化的信心。人類還會(huì)評(píng)估他們對(duì)自己所學(xué)知識(shí)的信任程度,并用其來權(quán)衡以往的知識(shí)與現(xiàn)在的證據(jù)(52)。信心可以通過非語言交際的形式進(jìn)行評(píng)估,即通過回顧來測(cè)量人類是否堅(jiān)持自己的最初選擇,抑或預(yù)期地讓自己決定從一項(xiàng)任務(wù)中退出,以至連嘗試都未曾嘗試。這兩種測(cè)量都曾被用于非人類動(dòng)物,以表明它們也具有元認(rèn)知能力(53)。相比之下,現(xiàn)有的大多數(shù)神經(jīng)網(wǎng)絡(luò)都不具有這一能力:雖然, 它們也可以學(xué)習(xí),但它們通常缺乏對(duì)所學(xué)知識(shí)的信度和范圍的元常識(shí)(meta-knowledge)。 一個(gè)明顯的例外是依賴貝葉斯機(jī)制的生物約束模型(biologically constrained models),用來模擬神經(jīng)電路中多個(gè)概率線索的集成(54)。這些模型在描述神經(jīng)群體如何自動(dòng)計(jì)算一個(gè)指定過程執(zhí)行的成功概率方面已經(jīng)取得豐碩的成果。盡管,這些實(shí)施仍然很少見,而且也沒有像傳統(tǒng)的人工智能那樣解決相同范圍的計(jì)算問題,但是,它們畢竟為將不確定的監(jiān)控結(jié)合到深度學(xué)習(xí)網(wǎng)絡(luò)中提供了一個(gè)有希望的檢驗(yàn)場(chǎng)所。 對(duì)前額皮質(zhì)的明確信任 Explicit confidence in prefrontal cortex 根據(jù)貝葉斯計(jì)算,每個(gè)局部皮質(zhì)電路可以表示和組合概率分布,以評(píng)估處理的不確定性(54)。然而,為了明確地提取和操縱信任信號(hào),可能需要額外的神經(jīng)電路。人類的核磁共振成像(MRI)研究和靈長類動(dòng)物,甚至包括大鼠身上的生理記錄都將這種信任處理與前額皮質(zhì)(prefrontal cortex)特別地連接在一起(55-57)。前額皮質(zhì)的失活可以誘發(fā)二級(jí)(元認(rèn)知)判斷的特定缺陷,同時(shí)保留一級(jí)任務(wù)的表現(xiàn)(56,58)。因此,前額皮質(zhì)的電路可能已逐步進(jìn)化到可監(jiān)控其他大腦處理進(jìn)程的表現(xiàn)。
誤差檢測(cè):顯示一個(gè)人自身的錯(cuò)誤 Error detection: Reflecting on one’s own mistakes 誤差檢測(cè)提供了一個(gè)特別明顯的,有關(guān)自我監(jiān)控的例子; 在收到回應(yīng)之后,我們有時(shí)會(huì)意識(shí)到,我們犯了錯(cuò)誤,因此,改變了主意。誤差檢測(cè)是通過腦電圖(EEG)活動(dòng)的兩個(gè)組成部分顯示出來:誤差的負(fù)相關(guān)性(ERN)和誤差正性(Pe),它們?cè)谑盏饺魏畏答佒?,即一個(gè)錯(cuò)誤的反應(yīng)之后,就出現(xiàn)在皮層和前額皮質(zhì)內(nèi)側(cè)。 人的大腦怎么會(huì)犯錯(cuò)誤呢,又是怎樣察覺的呢?一種可能性是,在做出決定之后,感覺證據(jù)的積累仍在繼續(xù)進(jìn)行,而當(dāng)進(jìn)一步的證據(jù)指向相反的方向時(shí),錯(cuò)誤就被推斷出來(59)。第二種可能性則是,二個(gè)并聯(lián)電路,即一個(gè)低級(jí)的感覺電路和一個(gè)高級(jí)的意圖電路,與誤差檢測(cè)的顯著速度更加相容,無論其結(jié)論是多么不同,均對(duì)相同的感覺數(shù)據(jù)發(fā)生作用(60,61)。 元記憶 Meta-memory 人類不只是了解世界上的各種事情,他們實(shí)際上也了解,自己可了解的事情或自己不了解的事情。一個(gè)熟悉的例子是“在舌尖上”這個(gè)詞。“元記憶”(Meta-memory)這一術(shù)語的創(chuàng)造,就是為了說明人類對(duì)自己的記憶有著認(rèn)識(shí),信任和質(zhì)疑的感覺。元記憶也被認(rèn)為是,涉及到二階系統(tǒng),可通過監(jiān)控內(nèi)部信號(hào)(例如,記憶痕跡的強(qiáng)度和質(zhì)量)來調(diào)節(jié)行為。元記憶與前額結(jié)構(gòu)有關(guān),其藥理作用失活會(huì)導(dǎo)致元認(rèn)知障礙,同時(shí)失去了記憶表現(xiàn)本身(56)。元記憶對(duì)人類學(xué)習(xí)和教育至關(guān)重要,它允許學(xué)習(xí)者開發(fā)學(xué)習(xí)策略,諸如增加學(xué)習(xí)量或調(diào)節(jié)分配給記憶編碼和訓(xùn)練的時(shí)間(49)。 現(xiàn)實(shí)監(jiān)控 Reality monitoring 除了監(jiān)控感覺和記憶再現(xiàn)的質(zhì)量之外,人類大腦還必須能區(qū)分自我生成和外部驅(qū)動(dòng)的表征。事實(shí)上,我們可以感知事物,但是,我們也可以通過想象力或記憶聯(lián)想起它們。而精神分裂癥的幻覺則與不能正確區(qū)分感知活動(dòng)是自己產(chǎn)生還是由外部世界生成有關(guān)(62)。所謂神經(jīng)成像(Neuroimaging) 研究已將這種現(xiàn)實(shí)監(jiān)控與前額皮質(zhì)聯(lián)系起來(63)。在非人類動(dòng)物中,前額皮質(zhì)中的神經(jīng)元可區(qū)分正常的視覺感知和記憶中相同視覺內(nèi)容的活躍維持(64)。 嬰兒的C2意識(shí)的基礎(chǔ) Foundations of C2 consciousness in infants 自我監(jiān)控是一種基本能力,它在嬰兒期就已經(jīng)存在(圖3)。當(dāng)1歲的嬰兒在一個(gè)感知決策任務(wù)中做出錯(cuò)誤的選擇時(shí),我們即會(huì)觀察到ERN, 即誤差監(jiān)控(65)。同樣,一歲半的嬰兒為了獲得一個(gè)隱藏的玩具,在指向兩個(gè)盒子中的一個(gè)后,當(dāng)他們的初始選擇是正確的時(shí)候,他們要比做出錯(cuò)誤的選擇等待更長的時(shí)間以獲得即將到來的獎(jiǎng)勵(lì)(比如玩具),這表明,他們有可能已監(jiān)控到自己的決定是正確的(57,65)。此外,如果有機(jī)會(huì)(以非語言的形式)詢問父母的幫助,他們會(huì)選擇不參加這一選項(xiàng),特別是在他們有可能出錯(cuò)的嘗試中,以展現(xiàn)對(duì)他們自身的不確定性的預(yù)期估計(jì)(66)。 嬰兒們還可以把自己的不確定性傳達(dá)給其他人,這進(jìn)一步表明,他們能有意識(shí)地體驗(yàn)元認(rèn)知信息(meta-cognitive information)。由此,可以看出,嬰兒已經(jīng)具備監(jiān)控自己心理狀態(tài)的能力。面對(duì)一個(gè)一切仍有待學(xué)習(xí)和了解的世界,C2機(jī)制允許他們積極地定向他們所知和所不知的領(lǐng)域–即一個(gè)我們稱之為“好奇”的機(jī)制。 圖3自我監(jiān)控:第二感覺(C2)上的意識(shí)。 自我監(jiān)控(Self-monitoring)(也稱為“元認(rèn)知”),是反映一個(gè)人自身心理狀態(tài)的一種能力,在嬰兒期就可獲得。 (上圖)一歲半的嬰兒在決定指出某個(gè)玩具的隱藏位置之后,顯示出有關(guān)其具有自我監(jiān)控決定的兩種類型的證據(jù)。(i) 當(dāng)他們認(rèn)為最初的選擇是正確的時(shí)候,他們?cè)谝堰x擇的盒子里搜尋隱藏對(duì)象的時(shí)間,要比在不正確的時(shí)候持續(xù)更長。(ii)當(dāng)他們有機(jī)會(huì)尋求幫助時(shí),他們會(huì)有選擇地使用這一選項(xiàng)以減少發(fā)生錯(cuò)誤的概率。 (下圖)向一歲的嬰兒展現(xiàn)一種無意義的模式或一張可見或不可見的臉(視其持續(xù)時(shí)間而定),然后再?zèng)Q定,向左或向右凝視,以期待這張臉再現(xiàn)。對(duì)于手動(dòng)搜索來說,與錯(cuò)誤的初始決定相比,在相同的凝視位置等待后決定的時(shí)間將更久。此外,當(dāng)嬰兒做出不正確的選擇時(shí),腦電圖(EEG)信號(hào)也揭示了,在額中樞電極上存在著與誤差相關(guān)的消極性。這些元認(rèn)知標(biāo)記是由可見的,而不是由不可見的刺激所引起,這在成人中也是如此(61)。 C1和C2之間的分離狀態(tài) 根據(jù)我們的分析, C1和C2在很大程度上是我們稱之為意識(shí)的正交和互補(bǔ)維度。在這種雙重分離的一方,自我監(jiān)控可為不可報(bào)告的刺激而存在(沒有C1的C2)。自動(dòng)打字為此提供了一個(gè)很好的實(shí)例:人們?cè)诖蝈e(cuò)之后,會(huì)自動(dòng)慢下來,即使沒有有意識(shí)地關(guān)注這一錯(cuò)誤(67)。同樣,在神經(jīng)層面,ERN現(xiàn)象可以在主觀尚未檢測(cè)到錯(cuò)誤時(shí)就發(fā)生了(68)。 在這種分離的另一方,那種有意識(shí)地可報(bào)告的內(nèi)容,有時(shí),并不帶有足夠的信任感(如,沒有C2 的C1)。例如,當(dāng)我們檢索一個(gè)記憶時(shí),它會(huì)突然跳入到意識(shí)中(C1),但時(shí)常對(duì)這種信任(C2)并任何做任何準(zhǔn)確的評(píng)估,從而導(dǎo)致錯(cuò)誤的記憶。正如馬文·明斯基(Marvin Minsky)所指出的那樣,“我們所謂的意識(shí)(在C1感覺上)是部分大腦對(duì)正在做的一些事情的一個(gè)非常不完美的總結(jié)”。這一缺陷,在某種程度上,來自于這樣的事實(shí),即總體工作空間在對(duì)一個(gè)單一的意識(shí)樣本進(jìn)行概率計(jì)算時(shí)減少了復(fù)雜的并行感覺流(27-29)。因此,概率信息經(jīng)常會(huì)在途中丟失,而被試對(duì)于他們的感知準(zhǔn)確性,卻感到過于自信。 賦予機(jī)器以C1和C2意識(shí) Endowing machines with C1 and C2 機(jī)器如何被賦予C1和C2意識(shí)以進(jìn)行計(jì)算?讓我們?cè)倩氐狡嚾加椭甘酒鞯睦?。在?dāng)前的機(jī)器中,“汽油不足燈光顯示”是一種典型的無意識(shí)模塊化信號(hào)實(shí)例(C0)。當(dāng)燃油指示燈不斷閃爍時(shí),機(jī)器中其它的處理器卻仍保持不知和不變; 燃料繼續(xù)注入汽化器中,汽車甚至徑直穿過那些加油站而不停(盡管,這些加油站都可能顯示在GPS地圖上)。 目前的汽車或手機(jī)僅僅是特定模塊的集合,這些模塊在很大程度上,彼此間是不共享信息的。賦予這臺(tái)機(jī)器以總體信息可用性(global information availability)(C1)將允許這些模塊共享信息,并協(xié)作解決即將發(fā)生的問題(很像,人類在意識(shí)到燈光閃動(dòng)時(shí)所做或饑渴的大象所做)。 盡管,人工智能在解決具體問題方面已經(jīng)取得了很大的成功,但在一個(gè)單一的系統(tǒng)中實(shí)施多個(gè)流程,并靈活地協(xié)調(diào)它們,仍然是一個(gè)難題。在20世紀(jì)60年代,被稱為“黑板系統(tǒng)”(“blackboard systems”)的計(jì)算架構(gòu)是專門用于發(fā)布信息,并以一種靈活和可說明的方式提供給其他模塊使用,這與當(dāng)前的總體工作空間就很相似(20)。 最近,一種被稱之為Pathnet的架構(gòu),即使用遺傳算法,并通過其許多專用神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí),以得出哪條路徑最適合一個(gè)特定的任務(wù)(72)。這一架構(gòu)展現(xiàn)出強(qiáng)大的,靈活的性能和跨任務(wù)模塊的泛化,這可能構(gòu)成機(jī)器具有靈長類的靈活性意識(shí)的第一步。 為了更好地利用燃油指示器所提供的信息,讓汽車擁有可顯示自己的油量和極限的數(shù)據(jù)庫將是非常有益的。這樣的自我監(jiān)控(C2)將包括自身的,互相協(xié)調(diào)的圖像--如當(dāng)前位置和燃料消耗。以及其內(nèi)部數(shù)據(jù)庫(諸如“知道”它擁有一個(gè)可定位加油站的GPS地圖)。 當(dāng)今,大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)都缺乏自我監(jiān)控; 他們的計(jì)算(C0)并不能代表其知識(shí)的范圍和限度,或者說,他人可能有與其不同的觀點(diǎn)。 但也有些例外:貝葉斯網(wǎng)絡(luò)(Bayesian networks)(54)或程序(73)是通過概率分布進(jìn)行計(jì)算的,那么,怎么能追蹤它們的正確性。即使,主要計(jì)算由傳統(tǒng)的CNN來完成,對(duì)內(nèi)省來說,也是不透明的,所以,我們可以對(duì)第二層級(jí)較高的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以預(yù)測(cè)第一個(gè)人的表現(xiàn)(47)。這種方法聲稱,在一個(gè)系統(tǒng)中重新描述自己會(huì)導(dǎo)致“內(nèi)部模型的出現(xiàn),而這些模型本質(zhì)上是元認(rèn)知的,并且使代理人有可能開發(fā)一種(有限的,內(nèi)隱的和實(shí)際的)對(duì)自身的理解”(48)。 Pathnet(72)使用一個(gè)相關(guān)的架構(gòu)來跟蹤在一個(gè)特定任務(wù)中的內(nèi)部構(gòu)形是最成功的,并利用這一知識(shí)來指導(dǎo)后續(xù)處理。機(jī)器人也被編程用來監(jiān)控其學(xué)習(xí)進(jìn)度,并利用它確定有關(guān)問題的資源,以最大化地獲取信息,從而實(shí)現(xiàn)一種好奇心(74)。 較少受到關(guān)注的,C2的一個(gè)重要功能是現(xiàn)實(shí)監(jiān)控。人工智能的貝葉斯方法(2,73)已經(jīng)認(rèn)識(shí)到,學(xué)習(xí)生成模型(learning generative models)的效益,可以共同適用于實(shí)際感知(現(xiàn)在),預(yù)期計(jì)劃(未來)和回顧性分析(過去)。在人類中,感知和想象均涉及到相同的感官領(lǐng)域。 因此,我們需要一些機(jī)制來區(qū)分自我生成和外部觸發(fā)的活動(dòng)。一種強(qiáng)大的訓(xùn)練生成模型的方法稱之為對(duì)抗學(xué)習(xí)(adversarial learning)(75),這涉及到一個(gè)二級(jí)網(wǎng)絡(luò)與一個(gè)生成網(wǎng)絡(luò)的“競爭”,以便批評(píng)性地評(píng)估自生表征的真實(shí)性。當(dāng)這種現(xiàn)實(shí)監(jiān)控(C2)與C1機(jī)制相結(jié)合時(shí),由此, 產(chǎn)生的機(jī)器可能更接近模仿人類意識(shí),從而在總體范圍內(nèi)獲得知覺表征,并直接意識(shí)到,其內(nèi)容是對(duì)當(dāng)前世界現(xiàn)狀的真實(shí)反映。 結(jié)論 我們的立場(chǎng)是基于這樣一個(gè)簡單的假設(shè):我們所說的“意識(shí)”來源于特定類型的信息加工計(jì)算,從生理上看,這些計(jì)算是由大腦的硬件所實(shí)現(xiàn)的。它與其他理論所不同的是,其計(jì)算是堅(jiān)決的,執(zhí)意的; 我們推測(cè),僅靠信息理論量(76)是不足以定義意識(shí),除非,我們也考慮到,正在加工的信息的性質(zhì)和深度。 我們還認(rèn)為,一臺(tái)被賦予C1和C2意識(shí)的機(jī)器,其表現(xiàn)就如同具有意識(shí); 例如,它會(huì)知道,它正在看什么,并表現(xiàn)出一種自信,再向他人報(bào)告,當(dāng)其監(jiān)督機(jī)制崩潰時(shí),它還可能體驗(yàn)到幻覺,甚至?xí)?jīng)歷與人類相同的那種錯(cuò)覺(perceptual illusions)。盡管如此,給這種意識(shí)下一個(gè)純粹的功能性定義,可能,仍然會(huì)令某些讀者感到不滿意。我們是不是可以通過這類假設(shè),一些高級(jí)認(rèn)知功能是否必然要與意識(shí)發(fā)生聯(lián)系,從而使意識(shí)“過度理性化”?我們能否先不考慮那些經(jīng)驗(yàn)成分(例如,“什么是有意識(shí)的”)?還有,一些主觀體驗(yàn)可否避開計(jì)算的定義? 雖然,這些哲學(xué)問題不在本文的討論范圍內(nèi),但是,我們?cè)趯?shí)證中會(huì)注意到,在人類中, C1和C2計(jì)算的損失是由于主觀經(jīng)驗(yàn)的喪失而造成的。例如,對(duì)于人類而言,對(duì)初級(jí)視覺皮層的損害可能會(huì)導(dǎo)致一種稱為“盲視”的神經(jīng)性病癥,在這種情況下,患者會(huì)報(bào)告,在受影響的視野中失明。值得注意的是,這些患者可以在他們的盲區(qū)中定位視覺刺激,卻不報(bào)告它們(C1),也不能有效地評(píng)估其成功的可能性(C2) -- 他們認(rèn)為,他們只是“猜測(cè)”。在這個(gè)例子中,主觀經(jīng)驗(yàn)似乎與擁有C1和C2有關(guān)。雖然,幾個(gè)世紀(jì)的哲學(xué)二元論(philosophical dualism)會(huì)導(dǎo)致我們把意識(shí)看作是不可還原的物理作用,但是,實(shí)驗(yàn)證據(jù)與意識(shí)的可能性則是一致的,即意識(shí)只能通過特定的計(jì)算而產(chǎn)生。 參考文獻(xiàn)
(底部有彩蛋) |
|
|