![]() 視覺與意識,這兩個主題構成了人類理解自身與世界的關鍵。視覺不僅僅是眼睛與大腦之間的信息傳遞,而是一個復雜的神經(jīng)過程,涉及從視網(wǎng)膜到視覺皮層的多層次處理。基于這些豐富的數(shù)據(jù)輸入,大腦為我們構建出一個連貫且動態(tài)的世界表征模型。這一模型不僅幫助我們感知外界,還直接塑造了我們的意識體驗。 視覺系統(tǒng)作為人類感知外界環(huán)境的重要途徑,其背后的神經(jīng)通路與信息處理機制究竟是怎樣的?我們?nèi)绾文軌蜓杆偾覝蚀_地識別他人的面部特征?我們又是如何基于感官輸入,構建出周圍世界的結構化模型,以實現(xiàn)對環(huán)境的有效理解與交互?更為根本的是,我們所體驗到的有意識的主觀經(jīng)驗,其神經(jīng)基礎與哲學本質究竟是什么? 為了深入探究這些兼具科學意義與哲學深度的核心問題,約翰斯?霍普金斯大學霍姆伍德自然哲學教授肖恩·卡羅爾(Sean Carroll)邀請加州大學伯克利分校分子與細胞生物學教授曹穎(Doris Tsao)展開了一場深刻的對談。兩位專家將圍繞視覺與意識的交匯點,探討大腦如何構建世界表征模型,以及意識的神經(jīng)基礎與哲學本質,為我們揭示大腦奧秘提供新的視角與洞見。 ![]() 肖恩·卡羅爾 Sean Carroll 約翰斯?霍普金斯大學霍姆伍德自然哲學教授,圣塔菲研究所分形學院成員 他從事物理學和哲學研究,并對世界最底層的運行機制感興趣。目前的研究興趣包括量子力學、時空、統(tǒng)計力學、復雜性和宇宙學等領域的基礎問題。著有《尋找希格斯粒子》、《大圖景:論生命的起源、意義和宇宙本身》等。同時,也是播客“心智圖景”(Mindscape)主理人。 ![]() 曹穎 Doris Tsao 加州大學伯克利分校分子與細胞生物學教授,海倫·威爾斯神經(jīng)科學研究所成員 她專注于視覺系統(tǒng)和面部識別的神經(jīng)機制研究,揭示了大腦面孔網(wǎng)絡系統(tǒng)的編碼原理,為理解大腦視覺信息處理機制提供了重要理論基礎。曾獲得了眾多榮譽,包括麥克阿瑟天才獎、埃彭多夫國際神經(jīng)生物學獎、NIH院長先鋒獎、米涅瓦金腦獎、珀爾神經(jīng)科學獎、卡夫利神經(jīng)科學獎等,并于2020年當選為美國國家科學院院士。 目錄: 01 視覺研究的尤里卡時刻 02 視覺錯覺與神經(jīng)通路之謎 03 意識機制理論的神經(jīng)維度 04 結構演化與意識離散問題 05 人腦面孔識別的神經(jīng)密碼 06 前沿實驗技術與神經(jīng)解碼 07 物體恒常性與貝葉斯大腦 08 意識的終極難題 ![]() 視覺研究的尤里卡時刻 肖恩·卡羅爾:許多人熟悉相機和像素的概念,容易認為視覺系統(tǒng)與之類似——通過檢測像素并解讀來“看到”的世界。但視覺系統(tǒng)遠比這復雜,我們并非直接檢測像素。那么,人類的視覺系統(tǒng)究竟如何工作? 曹穎:眼睛基本上就像一臺相機,光線穿過晶狀體,落在光感受器上,然后光感受器產(chǎn)生的所有信號通過視神經(jīng)傳輸?shù)揭曈X皮層。視覺皮層是一套令人難以置信的精密機器。在猴子的大腦中,它可能占據(jù)了大約三分之一的體積,是一個龐大的系統(tǒng)。在這個視覺皮層內(nèi),有數(shù)十個不同的區(qū)域,各自專門負責處理視覺世界的不同方面。它就像一個巨大的工廠,將像素轉化為你對空間中物體的感知。 在我們對視覺皮層的理解中,第一個重大突破,也就是ureka時刻(頓悟時刻),來自休伯爾(Hubel)和威塞爾(Wiesel)。他們當時是著名神經(jīng)生理學家斯蒂芬·庫夫勒(Stephen Kuffler)的博士后。庫夫勒當時正在記錄視網(wǎng)膜神經(jīng)節(jié)細胞(retinal ganglion cells,RGC)的活動,這些位于視網(wǎng)膜的細胞具有“中心-周邊”(center-surround)的特性?!爸行?周圍”表現(xiàn)為細胞偏好點狀光,而對非常彌散的光圖案沒有反應,因為感受野的中心區(qū)域受到周邊區(qū)域的抑制(中心-周邊拮抗機制),這意味著在視覺的視網(wǎng)膜早期階段就已開始減少信息冗余了。休伯爾和威塞爾決定順著解剖結構去探究這些RGC細胞在大腦中延伸到哪里。 首先是外側膝狀體核,此處細胞的反應類似RGC細胞也表現(xiàn)出“中心-周邊”的特性。進一步,深入到初級視覺皮層,他們發(fā)現(xiàn)了一個全新的世界。這些細胞突然對點狀光完全沒有反應了,而是需要來自邊緣的光刺激,并且不同的細胞會對視野中不同位置的邊緣產(chǎn)生反應(即“邊緣檢測”)。視覺信息的表征方式發(fā)生了如此巨大的轉變,這就像一道閃電。突然間,我們意識到有這樣一個機制在實際轉換像素信息,那么在邊緣檢測之后會發(fā)生什么呢?這一發(fā)現(xiàn)開創(chuàng)了整個研究領域,我很幸運能夠成為其中一員。 ![]() ![]() ?黑色為光線照射區(qū)域,豎條是細胞發(fā)放的頻率,光線只照射感受野中心(center)的時候細胞發(fā)放頻率最高,照射整個感受野的周邊(surround)時候發(fā)放頻率卻降低了(上圖)。當明暗的邊緣正好在感受野的“中心-周邊”邊緣時,細胞電位發(fā)放或急劇降低,或急劇升高。即這種機制可以讓視覺細胞對邊緣敏感。將邊緣信息提取出來交給高級皮層處理。圖源:Neuroscience Exploring the Brain,知乎。 肖恩·卡羅爾:這讓人聯(lián)想到深度學習網(wǎng)絡,不同的層級承擔著不同的任務。 曹穎:關于這一點存在一些爭議,但我認為神經(jīng)科學家們堅信,深度神經(jīng)網(wǎng)絡的靈感來源于休伯爾和威塞爾對視覺皮層的發(fā)現(xiàn)。 肖恩·卡羅爾:我很樂意把這份功勞歸給他們。你剛才提到了一個很有啟發(fā)性的觀點,視覺皮層占據(jù)了猴子大腦的三分之一。我猜它在人類大腦中所占比例不到三分之一吧。 曹穎:我不想隨意地給出具體數(shù)字,但如果你問人類大腦中有多大比例的區(qū)域會對視覺刺激產(chǎn)生反應,答案是幾乎整個大腦。我的同事杰克·艾倫(Jack Allen)讓人們躺在功能磁共振成像(fMRI)掃描儀中,給他們播放電影,結果整個大腦都活躍起來了。當然,其中很多反應是多模態(tài)的,它也會對文本、音頻等做出反應,但視覺刺激絕對是觸發(fā)了廣泛的大腦活動。因此,我認為廣義上的視覺皮層涵蓋了很大一部分區(qū)域。 ![]() 視覺錯覺與神經(jīng)通路之謎 肖恩·卡羅爾:某些神經(jīng)元(不限于初級神經(jīng)元),不僅會對像素有反應,還會對線、運動等做出反應,這是否有助于解釋視覺錯覺?或者,當相應的神經(jīng)元被激活,我們是否就能因此填補某些缺失信息? 曹穎:沒錯。一些特殊神經(jīng)元確實可以用于解釋視覺錯覺。有一個非常有趣的錯覺叫反轉φ現(xiàn)象(reverse phi),通過正確設置圖片對比度,就可以讓一輛自行車看起來像是在持續(xù)運動。這可以用大腦中運動處理區(qū)域的方向選擇性細胞的特性完美解釋。所以,是的,神經(jīng)元的特性有助于解釋視覺錯覺。 ![]() ?反轉φ現(xiàn)象,你是否感覺圖在連續(xù)地轉動?事實上這張gif是幾幀連續(xù)的正片緊接幾幀連續(xù)的負片,用前景背景的切換欺騙視覺系統(tǒng)對運動信號的處理。來源: Akiyoshi Kitaoka 2020 肖恩·卡羅爾:我們的大腦是為了識別我們?nèi)粘K姷氖挛锒莼?。因此,如果你給它展示一些不常見的事物,就可以欺騙它。 曹穎:沒錯。我所在的實驗室在面孔處理方面做了很多研究,我最喜歡的視覺錯覺之一,叫做撒切爾錯覺(Thatcher illusion)。繪制這樣一張面孔,其中所有面部特征包括眼睛、鼻子和嘴巴都倒過來,但保持面部輪廓朝上??梢韵胂?,這樣看起來會多么怪異。然后,再把這張怪異的臉上下顛倒過來,突然間,你就不會覺得那么奇怪了,它看起來又像一張正常的臉。 我喜歡這個錯覺現(xiàn)象的原因是,當你把臉顛倒過來時,實際上是在誘導你大腦中處理面孔的區(qū)域出現(xiàn)“損傷”,因為這些區(qū)域本來不是用來處理顛倒面孔的,所以它們會罷工——這樣你就能體驗大腦受損的感覺,你覺得自己什么都看到了,并不覺得缺少了什么。這讓我感到安心,當我失去理智時,至少我并不自知。 ![]() ?撒切爾錯覺。圖源:Discover Magazine 肖恩·卡羅爾:研究宇宙起源的物理學家面對的是個相對客觀的研究領域,而你在研究大腦和視覺時,卻也同時擁有大腦和視覺。這種雙重身份是否讓你在某一刻突然意識到:“原來這就是我的大腦正在做的事情啊?!?/span> 曹穎:每次都會有這種感覺。這是作為一名視覺科學家最美妙的事情之一。你睜開眼睛,就能看到你試圖解釋的奇跡,從某種意義上說,我們每個人都是視覺方面的專家。 肖恩·卡羅爾:我們所說的視覺皮層是有細分區(qū)域的,比如V1、V2和V3,這些不同區(qū)域分別發(fā)揮著什么作用? 曹穎:我很驚訝你居然聽說過V3,因為關于它的研究論文大概只有五篇。視覺相關腦區(qū)確實有很多不同的區(qū)域,但實際上我們對它們了解并不多。其中一個原因是,從事視覺神經(jīng)科學研究的人并不多,而且大家的研究方向比較集中。很多實驗室在研究V1,所以大家都關注V1。至于這些不同區(qū)域的功能,我們目前只有一些大致的概念。比如V1負責早期的邊緣處理,然后信息會傳遞到中間階段,可能會進行圖像分割,也就是識別不同物體的邊界,確定物體的表面屬性和紋理,之后處理過程會繼續(xù)向前推進。 視覺處理中有一個非常重要的原則,即存在兩條視覺處理通路,分別是背側通路和腹側通路,它們承擔著不同的功能。腹側通路專注于物體識別,比如認出那是一只豹子,或者這是我的媽媽。而背側通路則主要連接到運動皮層,它參與感知物體的空間位置和三維形狀,這樣我們就能以正確的方式抓取物體。大腦將這兩種功能分開,這一點非常有趣。 ![]() ?紅色:腹側通路,藍色:背側通路。來源: Principles of Neuralscience 肖恩·卡羅爾:我很好奇,大腦是如何知道要將這兩種不同功能分開的呢?你提到背側通路和腹側通路,這是否是“字面意義”的大腦中信息傳遞通路? 曹穎:是的,存在兩條不同的通路。我們之所以知道存在這種功能分工,是因為當人們大腦出現(xiàn)損傷時,會出現(xiàn)選擇性的功能障礙。例如,有些人可能無法識別物體,但抓取物體的能力不受影響;而另一些人則可能無法抓取物體,但可以準確地識別它們。這表明這兩條通路在物理上是分開的,并且承擔著不同的任務。 肖恩·卡羅爾:這非常有趣。實際上我本來沒打算過多談論意識問題,但這確實強化了一種觀點,即大腦的各個部分都在執(zhí)行非常專門化的任務,而我們所說的意識,某種程度上是由所有這些不同部分協(xié)同工作組合而成的。 曹穎:是的,沒錯。這是一個巨大的謎題。我記得在研究生時期,我的一位同學指出了這個謎團,到現(xiàn)在它仍然困擾著我。他指出,當你看邊緣時,邊緣是非常清晰、精細的。大腦中唯一的初級視覺皮層(V1)神經(jīng)元,具有足夠高的分辨率來表征這條邊緣。然而,你卻能意識到這條邊緣的存在。這怎么可能呢?這是否意味著V1是有意識的?如果是,是什么讓它產(chǎn)生了意識呢?因為根據(jù)我們對V1的理解,我得說,V1的處理過程看起來相當普通,就像一個邊緣檢測器,在我的實驗室編程就可以實現(xiàn)這一過程。那么,是什么賦予了它意識呢?這是一個很大的謎團。 ![]() 意識機制理論的神經(jīng)維度 肖恩·卡羅爾:這讓我想起了一種現(xiàn)象,它不完全算是視覺錯覺。比如當我們看到模糊的圖片時,人們會問,“你在云朵里看到了什么?是長頸鹿、臉還是其他?”他們說的東西,無論是什么,我往往最終也能看到。就像它進入了我的大腦,而我似乎無法擺脫這種暗示。 曹穎:確實如此。有一種關于意識的機制理論,我認為它并不能解釋意識的奧秘——到目前為止,我還沒有遇到過任何一種理論能夠真正解釋意識的奧秘——有人稱之為預測加工理論或生成模型理論。其基本觀點是,我們所意識到的一切都是由大腦生成的。外界信息進入大腦并接受處理,為意識內(nèi)容的生成提供了輸入。但實際上,我們有意識地感知到的是一種自上而下的過程,這個過程實際上是大腦重新構建了我們對世界的認知。 我認為這個理論非常美妙。原因有很多,其中一個特別的原因是,它解釋了為什么我們的意識感知在不同層次的表征中總是保持一致。比如,當你給我展示空間-花瓶錯覺(space-vase illusion)時,你可以把圖形看成是兩張側臉,也可以看成是一個花瓶。當你把它看成是一個花瓶時,不僅高層次的認知告訴你這是一個花瓶,而且所有的細節(jié)也都符合花瓶的特征。觀察花瓶邊緣的局部,都是屬于花瓶而非臉的一部分。從幾十年的神經(jīng)生理學研究中我們知道,這些細節(jié)信息是在與編碼物體身份不同的腦區(qū)進行編碼的。 那么,這種同步性是如何實現(xiàn)的呢?而且當你將其視為花瓶時,兩邊的邊緣總是保持一致的。你永遠不會看到一邊是側臉,另一邊是花瓶,因為這不符合邏輯。這又是怎么做到的呢?因為編碼邊緣所屬關系的V2區(qū)域中,編碼臉左側邊緣的神經(jīng)元并不會直接與編碼右側邊緣的神經(jīng)元進行交流。那么,它們是如何總是保持一致的?這需要一個解釋。而預測編碼理論(predictive coding theory)正好優(yōu)雅地解釋了這一點。它認為,意識是通過自上而下的反饋生成的,這就很好地解釋了這個現(xiàn)象。因為大腦“知道”這是一個花瓶,所以它“生成”了這兩個邊緣,它們必須保持一致。 ![]() ?空間-花瓶錯覺。圖源:Wikipedia 肖恩·卡羅爾:有道理。你的意思是,我們的大腦并非逐像素地存儲圖像,而是擁有一個關于世界的概念模型。當我們看到某樣東西時,大腦會將其與已有的概念框架相匹配,并按照這個框架來理解和解釋信息。只有當新的信息出現(xiàn),且與現(xiàn)有框架不符時,我們才會被迫調整或改變認知。是這樣嗎? 曹穎:是的,完全正確。我還有一種想法——大腦就像是一個視頻游戲引擎。存在一個它必須去認知的現(xiàn)實空間,我們的感知就存在于這個空間里。所有的輸入信息是在調節(jié)參數(shù)旋鈕,然后就“生成”出現(xiàn)實。 肖恩·卡羅爾:具體地還有一點需要提及,那就是信息并不是單向傳遞的,并不是說我們眼睛看到光子,它們傳到V1區(qū),再傳到V2區(qū),然后在其他地方構建出現(xiàn)實認知。實際上大腦中同時存在著反饋和前饋機制。 曹穎:是的,大腦中有大量的反饋連接。幾乎在每個區(qū)域都有。好像只有從下顳葉皮層到紋狀體的連接是單向的——只從IT皮層傳到紋狀體。但除此之外,大腦中幾乎每一個連接都是雙向的。 肖恩·卡羅爾:如果我們簡單把V1區(qū)的作用看作是檢測明暗和形狀等信息,那么它是如何受到大腦其他部分影響的呢?它似乎有自己的任務,應該只專注于此才對。 曹穎:預測加工模型的觀點是,這就像一整排多米諾骨牌。比如你覺得自己在云朵中看到了一張臉,這會使V2區(qū)傾向于生成相應的邊緣信息,然后這些信息會反饋回V1區(qū),V2區(qū)會告訴V1區(qū),比如“這里應該更暗一點,因為這是眼睛的位置”,V1區(qū)就會據(jù)此填補信息。我們實驗室在過去五年里一直在尋找支持預測加工生成反饋假設的證據(jù),但得這么說,目前還沒有定論,仍待進一步研究。 ![]() 結構演化與意識離散問題 肖恩·卡羅爾:在演化史上,下顳葉皮層比視覺皮層更晚出現(xiàn)嗎?聽起來它的功能更高級。 曹穎:是的,這是個很有趣的問題。正是因為對這個演化問題感興趣,我們進行了一項對樹鼩的研究。樹鼩是一種原產(chǎn)于印度尼西亞的動物,它們是與靈長類關系最近的非靈長類動物之一,并且擁有非常出色的視覺系統(tǒng)。很多實驗室研究老鼠的視覺,但老鼠的視力很差,它們大腦中負責視覺的部分只占很小的比例。而樹鼩有很大的眼睛,視力很好,視覺敏銳度高。 我們對“樹鼩是否也有下顳葉皮層”這個問題很感興趣。結果非常令人驚訝,樹鼩的V2 區(qū),似乎承擔了很多下顳葉皮層的功能,甚至發(fā)現(xiàn)了對面孔有反應的細胞。所以,思考下顳葉皮層功能的演化過程很有意思。我們認為它最初的層級結構比較簡單,后來逐漸變得復雜。 肖恩·卡羅爾:也許樹鼩最初沒有下顳葉皮層,但隨著時間推移,功能逐漸分化。那些更擅長這些功能的樹鼩會成為更強的生存者。 假設有人在運球,籃球撞擊地面的聲音傳到你耳朵的時間,實際上比畫面被看到所需的時間要長。顯然,光的傳播速度比聲音快,但你的大腦會把兩者匹配起來,讓你感覺它們是同時發(fā)生的。除非運球的人離你很遠,這種匹配不再合理,這時你才會突然意識到兩者是不同步的。你如何看待這種現(xiàn)象? 曹穎:是的,聽起來很合理。我認為這也支持了預測編碼的觀點。我們所看到的東西是大腦生成的,我們接收到各種信號,這些信號在時間上是不匹配的。但大腦通過推理將它們整合起來?;氐揭庾R這個話題,我們認為,把所有這些信息整合起來并構建出我們有意識看到的東西的這個推斷過程,是分開發(fā)生的。 實際上,盡管意識感覺上是連續(xù)的,但我們認為其發(fā)生是離散的。在這些離散的時間點之間,大腦在進行各種信息測量。這讓我們對時間感知有一個非常有趣的視角:它是被構建出來的,而不是信號抵達時你就立刻感知到事件的發(fā)生。剛剛提到的例子對此的闡釋確實很精彩。 ![]() ?圖源:-Simon Brader 肖恩·卡羅爾:我知道大腦構建圖像是需要時間的,這會導致延遲。但你剛剛說的內(nèi)容非常有趣,我之前沒聽說過,你說我們對時間的感知就像電影膠片一樣,是由一系列離散的幀組成的,這些幀之間有一些細微的差別。因為幀的數(shù)量很多,所以我們感覺時間是連續(xù)的,但實際上我們有意識的不同時刻之間是存在離散性的。 曹穎:是的,沒錯。是離散的幀。而且我要說的比這更激進,這些離散的幀不像電影膠片那樣是連續(xù)的,中間還穿插著一些我們無意識的時間段,然后又會再次進入有意識的狀態(tài),就好像這些畫面中間有一些片段是被“剪掉”了。膠片仍在播放,但因為你在某些時間段是無意識的,所以你甚至都沒有意識到在這些無意識的時間段里發(fā)生了什么——所以你所意識到的只是那些你有意識的幀。我們認為實際情況就是這樣。 再回到視覺錯覺的話題。你知道車輪錯覺(wagon wheel illusion)嗎?如果你在一個圓盤上,以不同半徑繪制不同頻率的黑白圖案,當你旋轉這個圓盤時,就會有一部分看起來像是在向后移動,這是因為混疊現(xiàn)象(aliasing)。如果你用膠片拍攝旋轉的圓盤,也會出現(xiàn)部分看起來向后移動的情況。但實際上在現(xiàn)實生活中你也能看到這種現(xiàn)象。戴爾?普爾維斯(Dale Purvis)是一位對視覺感興趣的發(fā)育神經(jīng)科學家,他從在現(xiàn)實生活中能看到車輪錯覺這一事實,得出了一個驚人的推斷:我們的意識是離散的,就像電影膠片是采樣得到的一樣。 ![]() ?車輪錯覺。圖源:etherealcreation 肖恩·卡羅爾:這實際上是一個基于經(jīng)驗的證據(jù)。我們的意識會中斷多長時間?在兩個連續(xù)的意識感知瞬間之間,存在著什么? 曹穎:我認為這取決于刺激的情況,比如刺激輸入的速度。在我們研究的情況中,發(fā)現(xiàn)有無意識的時間段可能長達幾百毫秒。在這段時間里,神經(jīng)元并沒有表征你有意識看到的東西。 肖恩·卡羅爾:竟然有這么長時間處于無意識狀態(tài)。這個觀點得到普遍認同了嗎,還是說這只是前沿的推測? 曹穎:我們還沒有發(fā)表這方面的研究成果呢。 肖恩·卡羅爾:我很期待看到后續(xù)的研究成果?,F(xiàn)有的計算機似乎比我們美妙的大腦簡單得多。作為一名堅定的物理主義者,我認為大腦是個機械系統(tǒng)。我可以想象未來我們能制造出一臺完全具備大腦功能的計算機。但我們在設計計算機時,會讓它盡可能直接、簡單,而大腦是經(jīng)過數(shù)百萬年演化而來的,以各種有用的方式將不同的能力整合在一起。 曹穎:作為一名實驗神經(jīng)科學家,我不得不說,大腦的組織精確得讓我驚嘆。 ![]() 人腦面孔識別的神經(jīng)密碼 肖恩·卡羅爾:那我們來談談大腦最令人印象深刻的能力之一——面孔識別。很明顯我們需要具備識別面孔的能力,那么大腦中有特定的區(qū)域負責這個功能嗎,還是說這個功能分布在不同的區(qū)域? 曹穎:我們識別面孔的能力很可能是大腦眾多功能中,與特定皮層區(qū)域關聯(lián)最為明確的功能之一。最早的證據(jù)來自于對腦部受損患者的研究,比如中風患者。他們可能突然就無法識別面孔了,但識別其他物體卻沒有問題。這就表明大腦中有一塊專門用于表征面孔的皮層區(qū)域。 1997年,麻省理工學院的南希?坎維舍(Nancy Kanwisher)發(fā)表了一篇具有里程碑意義的論文,這篇論文是《神經(jīng)科學雜志》上被引用次數(shù)最多的文章之一。她給正常人類受試者展示面孔和其他物體的圖片,同時進行了磁共振成像(MRI)掃描。結果發(fā)現(xiàn),所有受試者的右側顳葉都有一個區(qū)域,對面孔的反應比其他物體強烈得多。這個區(qū)域只有藍莓那么大,而且在每個受試者大腦中的位置都相同。當呈現(xiàn)面孔圖片時,這個區(qū)域會產(chǎn)生很強的信號反應。這是大腦存在專門表征面孔皮層區(qū)域的有力證據(jù)。這個區(qū)域被稱為梭狀回面孔區(qū)(fusiform face area,F(xiàn)FA),位于顳葉的梭狀回(fusiform gyrus)處。 我記得當初讀到這篇論文時,很奇怪為什么大腦會有一塊專門用于處理面孔的皮層區(qū)域?面孔看起來和其他物體并沒有那么大的區(qū)別。那時我完全沒想到自己會在這個領域深入研究這么多。 ![]() ?圖源:Li Yang Ku (Gooly) 肖恩·卡羅爾:梭狀回面孔區(qū)內(nèi)部是否也有細分結構,不同部分承擔不同的功能呢? 曹穎:是的,探究這個區(qū)域具體分工細節(jié)的過程非常精彩。我讀研究生的時候,為了研究猴子的立體視覺,進行了一系列腦影像學實驗。我給猴子展示面孔和其他物體,純粹出于好奇它們是否也有面孔識別區(qū)域。結果發(fā)現(xiàn)猴子不僅有面孔識別區(qū)域,而且還有六個。 這太讓人驚訝了,這六個區(qū)域分別有什么作用呢?因為研究對象是猴子,所以可以將電極插入每個區(qū)域,研究其中神經(jīng)元的活動。實際上,這六個區(qū)域中的每一個似乎都執(zhí)行著不同的功能。比如,最靠后的那個區(qū)域對眼睛的形狀特別敏感。再往前一個區(qū)域,關注特定視角下的面孔。更靠前的區(qū)域對面孔的鏡像對稱表現(xiàn)出反應,比如左右側臉或者向上、向下看的面孔。而最靠前的區(qū)域,有一些非常神奇的細胞,它們對面孔的反應不受視角影響,只要是同一張臉,無論朝向如何,都會產(chǎn)生反應。這種功能分工非常顯著。 肖恩·卡羅爾:所以我的大腦中有一部分專門負責注意眼睛。 曹穎:還有其他面部特征,但眼睛非常突出,所以在面孔區(qū)域中大約70%的細胞都會對眼睛的大小產(chǎn)生反應。你甚至可以展示一張簡單的卡通臉,改變眼睛部分的圖案,這些細胞的反應就會越來越強烈。 肖恩·卡羅爾:你給猴子展示的是猴子的臉還是人類的臉,這有區(qū)別嗎? 曹穎:實際上是有區(qū)別的,但它們用相同的編碼原則來處理所有不同的面孔,它們甚至對卡通臉和看起來像臉形狀的云彩也會有反應。 肖恩·卡羅爾:那么,這是否解釋了為什么簡單幾筆線條勾勒的卡通臉如此富有表現(xiàn)力?是不是因為我們的大腦已經(jīng)被“訓練”得能夠注意到這些細微的差別?而且這部分大腦區(qū)域可能與大腦中情緒化或與情感相關的區(qū)域存在某種聯(lián)系。 曹穎:是的,不過相比對面部表情的表征,我們對面孔同一性的表征了解得更多。但確實,我們有專門的機制來感知面孔的不同維度。要繪制出非常逼真的面孔,至少需要50到200個維度的信息,而我們能夠同時感知所有這些維度。這真的很了不起,要知道,顏色只有三個維度。你聽說過切爾諾夫臉(Chernoff faces)嗎?這是一種可視化多維數(shù)據(jù)集的方法,將數(shù)據(jù)映射到臉上,這樣就能看出有哪些維度在變化。 人類大腦中的梭狀回面孔區(qū),在猴子大腦中也有對應的同源區(qū)域。猴子的梭狀回面孔區(qū)屬于腹側視覺皮層,是高級視覺皮層的一部分,在 V1、V2區(qū)域之后。對這些不同面孔斑塊(patch)的記錄研究,從2000年前后開始,論文最終在2010年發(fā)表。 ![]() ?切爾諾夫臉,以人臉形狀展示多元數(shù)據(jù)。各個部分,如眼睛、耳朵、嘴巴和鼻子,通過形狀、大小、位置和方向來表示變量的值。使用人臉背后的理念是,人類容易識別面孔,并且能夠輕松地注意到細微的變化。圖為一種2017美國切爾諾夫臉,其中眉毛越矮越細,失業(yè)率越低,眼睛大小與教育水平相關,眼袋的大小告訴我們有多少成年人每晚至少睡七小時,下巴越大,肥胖率越高等。來源: Lazaro Gamio: The Emoji States of America 肖恩·卡羅爾:梭狀回面孔區(qū)的主要功能,是識別身份,還是識別表情(如微笑或皺眉)? 曹穎:我認為它主要不是處理情緒本身,而是處理面孔的物理特征,比如兩眼間距是多少、紋理如何、臉型是什么樣的。它還沒有達到明確識別身份的階段,我們認為這一步在后續(xù)的處理中完成。 ![]() 前沿實驗技術與神經(jīng)解碼 肖恩·卡羅爾:現(xiàn)階段我們是否已經(jīng)能夠研究單個神經(jīng)元的任務,還是說這仍然是一個技術挑戰(zhàn)? 曹穎:我們所有的記錄都是針對單個神經(jīng)元的。我們使用非常細的電極,這些電極除了尖端之外都是絕緣的,尖端寬度只有10微米。目前,我們可以同時采集數(shù)百個單個神經(jīng)元的電活動,以此探究單個神經(jīng)元的選擇性。 肖恩·卡羅爾:你提到了功能性磁共振成像(fMRI),現(xiàn)在又提到了電極,這是兩種截然不同的研究方法,對吧? 曹穎:沒錯。人們常說fMRI測量的是大腦的“管道系統(tǒng)”——檢測血液流經(jīng)區(qū)域。當大腦的某個部分工作時,會有更多血液流向該區(qū)域,這是一種體內(nèi)穩(wěn)態(tài)機制。所以,fMRI檢測的結果比較粗略,能夠在一立方毫米的尺度上測量神經(jīng)活動,而這一立方毫米內(nèi)包含大約10萬到100萬個神經(jīng)元。 而當我們確定了識別面孔、顏色的腦區(qū),我們就想進一步了解神經(jīng)元究竟是如何表征面孔的。而毫米級像素大小的研究,無法弄清楚這些細節(jié),我們需要單個神經(jīng)元層級的實驗技術。為了獲取這些詳細信息,我們會插入電極來采集神經(jīng)活動。我們現(xiàn)在使用一種叫做Neuropixels探針的設備,它就像是讓你能觀看大腦“電視節(jié)目”的工具。這種探針有4000個觸點,采用了硅制造技術。利用這些硅探針,我們可以同時記錄數(shù)百個神經(jīng)元的活動,這真的非常令人興奮。 肖恩·卡羅爾:我們能不能反過來,通過觀察神經(jīng)元的活動,自己推斷出正在觀察的是什么東西呢? 曹穎:可以。許多實驗室都致力于通過解碼神經(jīng)活動來復原人們眼前的事物,探究外界發(fā)生了什么。我們的面孔區(qū)域研究就做到了這一點,僅通過200個神經(jīng)元的神經(jīng)活動,就能精確重建猴子正在觀看的面孔,重建出的圖像與真實刺激幾乎難以分辨,這是一項非常令人滿意的成果。 ![]() ?圖源:Fausto Montanari 肖恩·卡羅爾:如果我們能把探針植入人類大腦,這項技術在腦機接口領域應該有更大的應用前景吧? 曹穎:即便我是一個徹底的物理主義者,想到如果有人能探測我所有的神經(jīng)元,就能知道我在想什么,還是會覺得有點詭異。但這就是我們研究的方向,所以我們必須學會應對。 有一種病癥叫面孔失認癥(prosopagnosia),患有這種病的人很難識別面孔,常見病因是腦損傷,但約有4%的面孔失認癥患者并沒有中風等腦部損傷,僅僅是在識別面孔方面表現(xiàn)得非常差。研究這些人的大腦活動會發(fā)現(xiàn),他們的面孔區(qū)域存在選擇性差、區(qū)域較小等問題。 肖恩·卡羅爾:面孔失認癥有改善的希望嗎,還是說目前這仍充滿挑戰(zhàn)? 曹穎:這很有意思。人類的面孔識別區(qū)域位于右半球,而左半球中對應的皮層區(qū)域負責識別字母。人類視覺系統(tǒng)具有顯著的可塑性,但我覺得這種可塑性在大腦發(fā)育早期發(fā)揮作用。所以,我并不確定,也許通過某種訓練有希望改善…… 肖恩·卡羅爾:面孔識別區(qū)從演化角度很容易理解,但視覺詞形區(qū)(專門識別文字的區(qū)域)讓人困惑:在人類發(fā)明文字之前,這個腦區(qū)承擔什么功能? 曹穎:我們認為,它之前可能也是負責識別面孔的。比如猴子,它們的面孔識別區(qū)域在兩側大腦半球都有,分布非常對稱。出乎意料的是,不識字的人沒有字母識別能力,他們的面孔識別區(qū)域也是雙側對稱的。 肖恩·卡羅爾:所以很明顯,大腦把原本用于識別面孔的部分區(qū)域重新利用,來幫助識別字母。這意味著,誰也不知道大腦還會有哪些區(qū)域被重新分工。那么,識字的人在識別面孔方面會比不識字的人更差嗎? 曹穎:我不確定,但從邏輯上看似乎是這樣。應該有人去驗證一下。 肖恩·卡羅爾:從某種意義上說,我們可以基于視覺研究的成果,嘗試理解大腦中的抽象思維,或者符號思維的起源。 曹穎:我在研究抽象思維起源這個問題時,采用的方法與面孔研究完全不同,抽象思維相關研究關注的是背側通路,而面孔識別是腹側通路的功能。一開始我就提到,背側通路是行動的基礎。那么我們?nèi)绾卧谑澜缰懈兄袆幽兀?/span> 我們需要一種壓縮的、符號化表征,例如基于事件的理解方式。我們要清楚識別周圍的物體及其可能用途,比如,我現(xiàn)在要去拿起那根香蕉。所以,在我看來,理解符號思維,關鍵在于解決物體分割和追蹤這個非常具體的問題。 我們的眼睛接收到的是一堆“像素”,問題在于如何將其轉化為一個個持續(xù)存在的“物體”。有了物體的概念,才能貼上標簽、建立聯(lián)系,進而思考它們;而如果沒有形成物體的概念,我們幾乎無法思考任何事情,只能面對一堆混亂的感官信息。所以我認為“轉化”是關鍵一步,而我們目前對此還完全沒有理解。在我看來,大腦究竟如何從大量感官信息和特征中構建出一個個離散的物體概念,是一個亟待解決的問題。 ![]() ?圖源:Fausto Montanari ![]() 物體恒常性與貝葉斯大腦 肖恩·卡羅爾:你在最近發(fā)表的一篇論文中嘗試解決之前提到的問題——我們?nèi)绾沃老嗤奈矬w是同一個。如果一個物體暫時被障礙物擋住,然后又從另一邊出現(xiàn),我們大腦為何仍然將其視為連續(xù)存在的同一個物體。 曹穎:對,比如我繞著你走,我知道你還是同一個人。怎么解決這個問題呢?計算機視覺領域的人可能會說,只要提供大量樣本、大量訓練數(shù)據(jù),系統(tǒng)就能神奇地學會識別。但我們在論文里提出,并不需要任何訓練/數(shù)據(jù)——這其實是一個非常優(yōu)雅的數(shù)學問題,與曲面(surface)的定義密切相關。 曲面是由一系列相互重疊的坐標圖(charts)組成的,這種重疊是關鍵。當我圍繞著你走的時候,我計算著這些坐標圖。由于移動或使用雙眼立體視覺的原因,視角會發(fā)生變化,從而提供相互重疊的坐標圖,這就表明它們屬于同一個曲面。我不斷這樣做,就能圍繞你形成一組坐標圖的等價類,這里的等價關系就是重疊。因此,這是一個非常美妙的數(shù)學理論,解釋了物體概念是如何形成的。 肖恩·卡羅爾:所以,實際上,大腦將不同視角的觀察整合為單一物體的表征,是否比把每個視角都視為獨立物體的效率更高? 曹穎:完全正確。因為視覺信息變化非常大,因此視覺系統(tǒng)的一個重要任務就是解決恒常性問題——確定哪些信息對應的是同一個物體。每轉動一下頭,進入眼睛的像素信息就全變了,但我們得應對這種變化。 肖恩·卡羅爾:從某種意義上說,這更像一個壓縮問題。再大膽猜測一下,這和貝葉斯大腦假說(Bayesian Brain Hypothesis)有關系嗎? 曹穎:有很大關系。我們的理論要解決的數(shù)學問題是,如何判斷一個視覺圖像塊的某個視圖是另一個視圖的變換結果?為此,我們引入了動態(tài)感受野(dynamic receptive fields)的概念。本質上,大腦的測量過程就像是將圖像塊投影到感受野函數(shù)上,通過內(nèi)積運算實現(xiàn)。在此基礎上,我們可以建立一個動態(tài)系統(tǒng)來變換感受野函數(shù),以抵消圖像的變化。 舉個簡單的例子,如果左眼看到的圖像塊比右眼看到的圖像塊偏移了10個像素,那么我把感受野函數(shù)也偏移10個像素,就能得到相同的測量結果。這就是我們的思路,引入感受野函數(shù)的動態(tài)變化,來補償圖像的變換。據(jù)我理解,這和貝葉斯推斷的過程完全一致。在貝葉斯推斷里,有一個自上而下的信號,試圖預測感官信號。對于每一個傳入的感官信號都是如此。 ![]() ?圖源:Fausto Montanari ![]() 意識的終極難題 肖恩·卡羅爾:這種理論是否能讓我們更接近理解意識,也就是我們在更抽象層面構建世界概念的能力? 曹穎:我希望如此。我覺得如果我們能搞清楚神經(jīng)活動如何表征所看到的事物,那就離理解意識不遠了。演化的目的是生存,基因并不關心我們是否有意識,它們只在乎我們的行為。所以在我看來,要么意識只是一個巧合,那些具有特定行為的大腦恰好也產(chǎn)生了意識;要么任何能夠像我們一樣復雜地感知世界、追蹤移動物體、導航,具備我們所有行為能力的系統(tǒng),都很可能是有意識的。你同意這種觀點嗎? 肖恩·卡羅爾:我完全同意。不過,確實有很多人不同意,在意識研究領域,僵尸論證(zombie argument)很有影響力,它由大衛(wèi)?查爾默斯(David Chalmers)推廣開來,但其實更早之前就有人提出了。這個論證的核心觀點是,想象存在一種生物,它的行為和我完全一樣,但沒有內(nèi)在的意識體驗,這種生物稱為僵尸(zombie)。如果能夠想象出這樣的生物,那就意味著內(nèi)在的意識體驗不能簡單地歸結為神經(jīng)元或身體里原子的行為——除了物理行為之外,一定還有其他因素決定意識。 但我的觀點和你的想法差不多。僵尸和有意識的生物的行為模式完全一樣,被問到“你有意識嗎”,它會回答“是”;給它講悲傷的故事,它會哭泣......那我們就應該把它看作是有意識的。作為一名物理主義者,我認為意識是一種涌現(xiàn)的、更高層次的概念,僅此而已,沒存在更多神秘物質。 曹穎:太好了,很高興你同意我的觀點。你寫過一篇很有意思的文章,叫《為什么存在萬物而非一無所有?》*。我很喜歡這篇文章。這篇文章的核心觀點是不是物理學家無法解釋這個問題? https://www./blog/2018/02/08/why-is-there-something-rather-than-nothing-2/ 肖恩·卡羅爾:實際上,我還可以更激進一點。我認為這甚至不是一個能回答的問題。不是說我們目前沒有能力解答,而是像“為什么存在某物而非一無所有”這樣的問題,根本就沒有答案。不存在什么原因,我們以后也不可能發(fā)現(xiàn)宇宙存在的理由。 曹穎:但我們能夠弄清楚一組神經(jīng)元需要怎樣的配置才會產(chǎn)生意識,這是一個科學問題。但對我來說,意識本身似乎是既定存在的。你認同這種觀點嗎? 肖恩·卡羅爾:我們需要先明確一下“既定存在”是什么意思。在我看來,意識當然是一種描述我們大腦活動以及宏觀行為的方式。 曹穎:意識就像物質的存在一樣,是一種既定事實。你只能接受某些復雜系統(tǒng)就是有意識的,但不能提問為什么它有意識。主觀體驗的存在和客觀體驗一樣,都是你必須接受的事實。你可以研究如何改變意識,創(chuàng)造不同類型的意識,這些都是科學問題。但主觀體驗存在這個基本事實,就像物質存在一樣,是你必須接受的。 肖恩·卡羅爾:如果我從未聽說過意識這個概念,假設我是奧利弗?薩克斯(Oliver Sacks)虛構的來自火星的人類學家,來到地球與人類互動。我會注意到,人類的反應和行為方式表明他們對不同事物有不同程度的反應。有時會忽略某些事物,有時又表現(xiàn)出一些心理狀態(tài),這些心理狀態(tài)能幫助我解釋他們的行為。即使我們之前不了解意識,也會發(fā)明出描述意識狀態(tài)和行為的概念,我認為這是對人類這種極其復雜的涌現(xiàn)現(xiàn)象的一種有用描述。 我寫過一篇論文,叫《意識與物理定律》*。但實際上,我對意識了解得并不多,我只知道,描述意識并不需要發(fā)明新的物理定律,因為我們對物理定律的理解比對意識的理解要深入得多。如果認為需要改變物理定律來幫助理解意識,這有點本末倒置了。 Carroll, Sean. 'Consciousness and the Laws of Physics.' Journal of Consciousness Studies 28.9-10 (2021): 16-31. 曹穎:意識有個很神秘的地方在于,作為物理學家、化學家和生物學家,我們從不同層面解釋各種系統(tǒng)。我們可以從非?;A的層面解釋,也可以從像光感受器、視覺皮層這些層面解釋,不同層面的解釋是相互一致的,而且在各自層面都能對系統(tǒng)進行完整的解釋和預測,只是更高層面的解釋更粗略一些。 但在我看來,意識的存在與這種觀點相悖。比如,我們能意識到紅色以及周圍的物體,這似乎表明對物理系統(tǒng)存在一個“正確的”解釋層面。不能僅僅把它看作是原子的隨機運動,而必須從意識感知存在的層面去理解。 肖恩·卡羅爾:我會認為這兩個層面都很好,而且各自獨立成立。如果我是拉普拉斯妖(Laplace's demon),擁有神奇的能力,能理解我身體里每一個原子、電子和光子的完整狀態(tài),那么我想我可以成功預測我身體接下來的行為,或者在一段時間內(nèi)的行為,而且整個過程都不需要用到“意識”這個詞。同樣,也不需要用到“熵”“溫度”這些更高層面的詞匯,我只需要描述原子的行為就可以了。 曹穎:但你無法解釋內(nèi)在的意識。 肖恩·卡羅爾:只列舉一張桌子所有原子以及它們之間的相互作用,就能解釋這是一張桌子嗎? 曹穎:可以。但說到大腦,情況就不一樣了。大腦存在有意識的體驗,而且這種體驗似乎只存在于某個特定層面。 肖恩·卡羅爾:沒錯。我的觀點是,意識就像桌子一樣,是一種在特定層面上描述事物的有用概念。這個層面和另一個不用這些概念、但同樣能完整描述事物的層面是完全兼容的。我一直很樂意聽取不同意見,所以我再換一種方式解釋。這可能和“為什么存在萬物而非一無所有”這個問題的討論有關。 意識的難題被認為是超越大腦物理行為的問題。那些熱衷于探討意識難題的人會探討“成為某種東西是什么樣的體驗”。這些擁有內(nèi)在的第一人稱主觀體驗的人聲稱,即使我知道了神經(jīng)元的所有行為、它們之間的相互作用以及如何驅動身體運動,我仍然無法解釋成為一只蝙蝠或一個人是什么樣的體驗。 而我的觀點是,就像“為什么存在萬物而非一無所有”這個問題一樣,這個難題是無法解決的,但會隨著我們對神經(jīng)元及其行為的更深入理解而逐漸“消解”。我們會發(fā)現(xiàn)其實并沒有什么額外的東西。當神經(jīng)元進行特定活動時,我們就把這種狀態(tài)稱為大腦正在體驗紅色的“紅”。 曹穎:我完全同意。我覺得隨著人工智能的發(fā)展和成熟,當它們也有意識時,我們就能創(chuàng)造出全新的認知,真正發(fā)現(xiàn)支配意識的規(guī)律。就像你說的,意識難題會完全消失,我們會發(fā)現(xiàn),意識只是復雜系統(tǒng)的一種基本屬性。 ![]() 編譯后記 阿瑤:大腦如何將紛繁的感官信息轉化為對世界的連貫認知?從視覺皮層的層級加工到面孔識別的神經(jīng)密碼,從預測加工理論到意識離散性的前沿假說,這場對話中有一點始終使我印象深刻:大腦并非被動接收外界信息的容器,而是主動構建現(xiàn)實的“生成引擎”。視覺系統(tǒng)的研究尤為典型。這似乎是演化賦予人類的一項生存本能,使我們能夠在混沌中提煉意義,在無序中獲得秩序。 當然,意識的終極難題或許終將消解于對復雜系統(tǒng)的深入理解,但就目前而言,它對我們?nèi)韵褚簧劝腴_的門,既讓我們觸摸到神經(jīng)活動與主觀體驗的關聯(lián),又提醒我們,人類對自身心智的認知,或許比對宇宙起源的追問更為艱深。毫無疑問,我們既是粒子與場的集合,又是意義與情感的載體。當我們追問大腦如何構建世界時,本質上就是在追問這樣一個問題:我們何以成為我們。而這一追問,恐怕永無止境。 為了閱讀體驗,本文對聽稿進行了適當?shù)鼐庉嫛?/span> 原對話指路: https://www./podcast/2024/07/29/284-doris-tsao-on-how-the-brain-turns-vision-into-the-world/ ![]() ![]() ![]() ![]() |
|
|