|
我們?cè)谏钪幸鎸?duì)各種各樣的決策。對(duì)哈姆雷特來說,活還是不活,這是個(gè)問題;包包買還是不買,救老媽還是救老婆,也都是難題。什么樣的時(shí)候人們會(huì)做什么樣的選擇?好奇的科學(xué)家一直以來都對(duì)大腦的決策機(jī)制充滿了興趣。 所謂“同樣的招式對(duì)圣斗士不能使用兩次”,在面對(duì)挑戰(zhàn)時(shí),經(jīng)驗(yàn)可以說是最為可靠的指導(dǎo)。然而,“不是我不明白,這世界變化快”,如果只是一味地墨守成規(guī),經(jīng)驗(yàn)有時(shí)又反而會(huì)成為生命不可承受的累贅。是從以往的過招經(jīng)驗(yàn)中尋找對(duì)手破綻以求見招拆招,還是索性徹底拋棄一切章法以期“亂拳打死老師傅”?最近發(fā)表在《細(xì)胞》雜志上的一篇研究顯示,我們的大腦中存在一種“開關(guān)”機(jī)制來決定我們究竟是去挖掘規(guī)律還是隨機(jī)行事。 研究團(tuán)隊(duì)采用的實(shí)驗(yàn)動(dòng)物是大鼠。“相比較于小鼠,大鼠擁有更復(fù)雜的大腦與更高的智商來處理復(fù)雜的任務(wù)。而較之靈長(zhǎng)類,它們更為廉價(jià),繁殖力也更強(qiáng),從而可以輕易得到足夠多的數(shù)量以積累更為可靠的數(shù)據(jù)?!蔽恼碌耐ㄓ嵶髡?,霍華德·休斯醫(yī)學(xué)研究所的阿娜·卡爾波娃(Alla Karpova)向果殼網(wǎng)介紹說,這一次他們給大鼠設(shè)計(jì)了一個(gè)類似于石頭剪子布的博弈游戲:大鼠被安排站在一面有三個(gè)孔的墻前面,在游戲一開始,大鼠將它的鼻子對(duì)準(zhǔn)中間的一個(gè)孔。之后,它可以選擇將鼻子探向它左邊或是右邊的孔,與此同時(shí),它的虛擬對(duì)手——一臺(tái)電腦則會(huì)猜測(cè)它會(huì)探向哪一邊。如果電腦猜錯(cuò)了,比如說電腦猜它會(huì)探向左邊的孔而它卻探向了右邊,那么這只大鼠將會(huì)得到一口美味的果汁作為獎(jiǎng)勵(lì)。
首先,卡爾波娃和她的團(tuán)隊(duì)為大鼠準(zhǔn)備了一個(gè)比較簡(jiǎn)單的對(duì)手,我們就暫時(shí)稱它為普通難度的電腦吧。這個(gè)虛擬對(duì)手可以根據(jù)大鼠之前的選擇來歸納這只大鼠的選擇規(guī)律,然后據(jù)此推測(cè)大鼠下一次的動(dòng)向。不過,就像一些學(xué)渣做選擇題不知道該選啥的時(shí)候,就遵循“三長(zhǎng)一短選最短,三短一長(zhǎng)選最長(zhǎng),長(zhǎng)度一樣就選C”之類的模式一樣,普通難度的電腦也會(huì)有類似的“固有選擇模式”。雖然大鼠們?cè)趧偯鎸?duì)這個(gè)對(duì)手的時(shí)候也被它虐得一敗涂地,但是大鼠們普遍都表現(xiàn)得不屈不撓,不斷改變著自己的選擇模式,并慢慢總結(jié)出了對(duì)手的預(yù)測(cè)規(guī)律,最終成功逆襲——這些“經(jīng)驗(yàn)豐富”的大鼠平均能達(dá)到60%的勝利率,不但大大高于它們一開始百分之四十多的勝率,也顯著超出了完全隨機(jī)選擇的成績(jī)。 然后,研究人員又設(shè)計(jì)了兩個(gè)更強(qiáng)的對(duì)手,我們不妨稱之為噩夢(mèng)難度的電腦和地獄難度的電腦吧。噩夢(mèng)難度的電腦在普通難度的算法基礎(chǔ)上,盡量去除了那些容易被識(shí)破的“固有選擇模式”;而地獄難度的電腦則干脆改用了一種非常復(fù)雜而強(qiáng)大的算法,要逃脫它的“洞察”是一件無比艱難的任務(wù)。在面對(duì)這些“高手”,尤其是地獄難度的電腦的時(shí)候,盡管大鼠們依然竭盡所能地去搜索電腦的破綻,但還是紛紛敗下陣來。 面對(duì)這個(gè)無法戰(zhàn)勝的對(duì)手,大鼠們最終改變了策略——它們放棄尋找對(duì)手選擇規(guī)律的努力,轉(zhuǎn)而采用一種完全隨機(jī)的沒有既定模式的“選擇模式”,并且隨著難度的增加,大鼠的選擇模式就會(huì)變得更加隨機(jī)。 為了確定大鼠確實(shí)是在做隨機(jī)選擇,研究人員們還在后面的研究中悄悄給地獄難度的電腦人為添加了一些隱藏的漏洞,比如說讓它在連續(xù)猜兩次左邊后有很高的幾率選右邊??柌ㄍ拚f:“我們通過這個(gè)隱藏規(guī)律來檢測(cè)大鼠是否真的采用了隨機(jī)選擇模式。如果大鼠還在采用總結(jié)規(guī)律的戰(zhàn)術(shù),那么它們一定能輕易發(fā)現(xiàn)這個(gè)新的隱藏規(guī)律;而相對(duì)地,如果它們決定隨機(jī)選擇的話就很難意識(shí)到這個(gè)提高勝率的機(jī)會(huì)?!?/p> 然而,在引入隱藏模式后,那些完全的新手或是只和普通難度的電腦過招過的大鼠可以迅速發(fā)現(xiàn)并利用這個(gè)規(guī)律,但那些開啟隨機(jī)模式的大鼠則依然繼續(xù)做著隨機(jī)選擇。卡爾波娃說:“在面對(duì)對(duì)手的時(shí)候,大鼠有一種天然的總結(jié)對(duì)手弱點(diǎn)的傾向。如果對(duì)手很弱,它們就會(huì)借助經(jīng)驗(yàn)來擊敗對(duì)手。只有當(dāng)對(duì)手足夠強(qiáng)大,以至于所有總結(jié)規(guī)律的努力都告失敗的時(shí)候,大鼠才會(huì)轉(zhuǎn)而采用隨機(jī)策略。這實(shí)際上達(dá)成了博弈論的最優(yōu)策略?!睆牟┺恼摰慕嵌葋碚f,如果能預(yù)測(cè)對(duì)手的出招套路,自然能增加自己的勝算,但當(dāng)對(duì)手強(qiáng)大到不可預(yù)測(cè)的時(shí)候,隨機(jī)選擇策略也至少能確保自己50%的勝率。 但大鼠顯然沒有接受過任何博弈論課程,它們只能依賴自己的腦子。為了一探大鼠決策時(shí)的腦部發(fā)生了什么,研究者進(jìn)行了后續(xù)實(shí)驗(yàn)。 在神經(jīng)科學(xué)研究中,要研究某個(gè)腦區(qū)的功能,最常用的方法就是先把這個(gè)腦區(qū)的功能給抑制住,看看行為會(huì)發(fā)生什么變化,然后再讓這個(gè)腦區(qū)的功能恢復(fù)乃至變得比以前更活躍,看看那些變化是否會(huì)得到逆轉(zhuǎn)。通過這種方法就可以獲得比較可信的腦區(qū)和行為之間的聯(lián)系,事實(shí)上,人類對(duì)于大腦中大部分腦區(qū)功能的理解都源于這類功能擾亂實(shí)驗(yàn)。 “前人的工作表明,前扣帶回(anterior cingulate cortex,ACC)編碼了動(dòng)物對(duì)環(huán)境的認(rèn)知模式。我們進(jìn)而假設(shè)這種認(rèn)知模式會(huì)影響動(dòng)物所作出的決策,這可能是決定動(dòng)物是否會(huì)切換到隨機(jī)選擇策略的關(guān)鍵所在?!笨柌ㄍ藿榻B說。
有鑒于此,他們首先通過一種精確度很高的顱內(nèi)定點(diǎn)注射法向前扣帶回腦區(qū)注射蠅蕈醇(muscimol)——這是一種短效神經(jīng)阻斷劑,可以暫時(shí)性地抑制前扣帶回的活動(dòng),使之喪失功能。他們發(fā)現(xiàn),在注射蠅蕈醇后,大鼠在面對(duì)普通和噩夢(mèng)難度電腦的時(shí)候都能夠更加執(zhí)著地搜尋規(guī)律,預(yù)測(cè)對(duì)手的選擇,并最終提高了自己的勝率;但是在面對(duì)地獄難度的電腦的時(shí)候,注射過蠅蕈醇的大鼠無論是行為模式還是勝率都沒有什么明顯的變化。這說明,在采用總結(jié)規(guī)律策略的時(shí)候,前扣帶回確實(shí)發(fā)揮了某種功能,而隨機(jī)選擇策略則并不需要前扣帶回的直接參與。 前扣帶回在兩種策略中發(fā)揮的不同作用暗示它可能就是負(fù)責(zé)切換兩種策略的開關(guān),然而開關(guān)不會(huì)自己動(dòng),那只操縱它的手是什么? “我們排查了多個(gè)既能作用于前扣帶回又與決策相關(guān)的腦區(qū),比如中腦腹側(cè)被蓋區(qū)(Ventral tegmental area,VTA)以及藍(lán)斑(Locus Coeruleus,LC)等等,最終通過一些功能擾亂實(shí)驗(yàn)證明藍(lán)斑才是我們要尋找的腦區(qū)。”卡爾波娃對(duì)果殼網(wǎng)說。藍(lán)斑是一個(gè)位于腦干的神經(jīng)核團(tuán),在整個(gè)腦中都有廣泛的神經(jīng)投射,幾乎所有的腦區(qū)都會(huì)接受來自藍(lán)斑的神經(jīng)傳入。這樣廣泛的對(duì)外神經(jīng)連接與藍(lán)斑的功能密切相關(guān):神經(jīng)元與神經(jīng)元之間的信號(hào)傳導(dǎo)依賴于一類專門的化學(xué)物質(zhì):神經(jīng)遞質(zhì),而藍(lán)斑正是大腦中最重要的神經(jīng)遞質(zhì)之一——去甲腎上腺素(Noradrenaline)的合成中心。從藍(lán)斑對(duì)外投射出去的神經(jīng)元像遍布全腦的高速公路一樣將它合成的去甲腎上腺素運(yùn)輸?shù)秸麄€(gè)腦中。藍(lán)斑中積累的大量去甲腎上腺素容易聚合成一種叫神經(jīng)黑色素(Neuromelanin)的有色物質(zhì),從而讓藍(lán)斑在解剖上呈現(xiàn)出一種獨(dú)特的青藍(lán)色,因此被稱為“藍(lán)斑”。
卡爾波娃的團(tuán)隊(duì)隨后借助于條件性轉(zhuǎn)基因的方法在大鼠藍(lán)斑向外投射的神經(jīng)元上表達(dá)某些特殊的蛋白質(zhì),這些蛋白質(zhì)像閥門一樣,使研究人員能按照自己的需要來調(diào)節(jié)藍(lán)斑向前扣帶回的去甲腎上腺素輸送量。實(shí)驗(yàn)結(jié)果表明,提高藍(lán)斑向前扣帶回的去甲腎上腺素輸送量,會(huì)導(dǎo)致大鼠更容易放棄總結(jié)規(guī)律;而減少去甲腎上腺素輸送量則能讓已經(jīng)在與地獄難度電腦對(duì)決中進(jìn)入隨機(jī)選擇模式的大鼠重新開始觀察對(duì)手,并迅速發(fā)現(xiàn)研究人員新設(shè)置的隱藏規(guī)律。這些結(jié)果提示,是藍(lán)斑對(duì)前扣帶回的去甲腎上腺素輸入水平?jīng)Q定了動(dòng)物所采取的策略。 在這之后,“我們將從個(gè)體神經(jīng)環(huán)路的層面來理解這些決策的神經(jīng)學(xué)原理?!?卡爾波娃透露,“具體來說包括前扣帶回的具體運(yùn)作機(jī)制,負(fù)責(zé)隨機(jī)選擇策略與產(chǎn)生隨機(jī)性的腦區(qū),隨機(jī)選擇的信號(hào)是如何在下游腦區(qū)整合的等問題。” “目前的研究表明,前扣帶回活躍程度的變化會(huì)指導(dǎo)動(dòng)物采用不同的決策以應(yīng)對(duì)未知的環(huán)境和規(guī)則?!笨柌ㄍ拚f,“但有的時(shí)候,這些變化會(huì)失去控制,從而導(dǎo)致習(xí)得性無助乃至抑郁癥等一系列不良反應(yīng)。在這種時(shí)候,抑制前扣帶回的去甲腎上腺素輸入也許是一個(gè)有效的療法?!保ň庉嫞篊alo) 參考文獻(xiàn):
文章題圖:tumblr.com |
|
|