小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

對(duì)話IJCAI2022特邀講者Leslie Kaelbling: 與AI和機(jī)器人結(jié)緣背后的故事

 新用戶0175WbuX 2022-01-29

 特邀報(bào)告(Invited Talks)作為 IJCAI 最受關(guān)注的環(huán)節(jié)之一,隨著會(huì)議的臨近,特邀講者名單也在相繼公布中。機(jī)器人作為人工智能領(lǐng)域的一個(gè)非常重要的研究方向,本次大會(huì)也特別邀請(qǐng)了機(jī)器人專(zhuān)家、麻省理工教授 Leslie Kaelbling 做特邀報(bào)告。屆時(shí),她將帶來(lái)主題為《Doing for our robots what evolution did for us》的特邀演講。

  Leslie Kaelbling 是麻省理工學(xué)院的機(jī)器人專(zhuān)家。 她在強(qiáng)化學(xué)習(xí)、規(guī)劃、機(jī)器人導(dǎo)航等人工智能研究領(lǐng)域獲得了引人注目的研究成果,其中包括將運(yùn)籌學(xué)中的部分可觀察的馬爾可夫決策過(guò)程應(yīng)用到人工智能和機(jī)器人中,曾獲得 IJCAI「計(jì)算機(jī)與思想獎(jiǎng)」(Computers and Thought Award)等重要獎(jiǎng)項(xiàng),同時(shí)她也是人工智能領(lǐng)域頗負(fù)盛名的《機(jī)器學(xué)習(xí)研究雜志》的創(chuàng)始人兼主編。

  近日,麻省理工學(xué)院教授 Lex Fridman 在其播客訪談節(jié)目《Artificial Intelligence Podcast》中與 Leslie Kaelbling 進(jìn)行了對(duì)話。對(duì)話中,Leslie Kaelbling 不僅分享了她從哲學(xué)領(lǐng)域轉(zhuǎn)入計(jì)算機(jī)科學(xué)領(lǐng)域,并與 AI 和機(jī)器人結(jié)緣的背后的故事,還詳細(xì)闡述了其對(duì)于機(jī)器人發(fā)展歷程以及現(xiàn)狀的見(jiàn)解。

  對(duì)話IJCAI2019特邀講者Leslie Kaelbling: 與AI和機(jī)器人結(jié)緣背后的故事

  AI 科技評(píng)論將采訪視頻整理成文如下,全文進(jìn)行了不改變?cè)獾膭h改。

  Leslie Kaelbling:說(shuō)到是什么讓我對(duì) AI 產(chǎn)生了濃厚的興趣,就不得不提我在高中時(shí)期閱讀的《哥德?tīng)枴釥?、巴赫》(G?del, Escher, Bach)。這本書(shū)對(duì)我來(lái)說(shuō)極具塑造性,它讓我感受到了原函數(shù)和組合函數(shù)的另一種趣味性,也讓我更加了解怎樣將復(fù)雜的事情與簡(jiǎn)單的部分區(qū)分出來(lái),并開(kāi)始思考怎樣的 AI 以及程序才能夠讓機(jī)器產(chǎn)生智能行為。

  Lex Fridman:因此您最開(kāi)始喜歡上的其實(shí)是 AI 與機(jī)器人的推理邏輯。

  Leslie Kaelbling:是的,喜歡機(jī)器人則是因?yàn)槲业牡谝环莨ぷ?。?dāng)時(shí)我從斯坦福大學(xué)的哲學(xué)專(zhuān)業(yè)畢業(yè),正打算去讀計(jì)算機(jī)科學(xué)的碩士,然后我被 SRI 錄用了,進(jìn)入到他們的 AI 實(shí)驗(yàn)室工作。他們當(dāng)時(shí)正在研發(fā)一款類(lèi)似于 Shaky 的后代機(jī)器人,但是 Shaky 原來(lái)的研發(fā)者都不在了,因此我的工作就是嘗試讓這個(gè)機(jī)器人擁有做事情的能力。這也是讓我真正對(duì)機(jī)器人產(chǎn)生興趣的契機(jī)。

  Lex Fridman:我們先稍微回顧一下您的大學(xué)生涯。您在斯坦福大學(xué)獲得了計(jì)算機(jī)科學(xué)的碩士和博士學(xué)位,但是您的大學(xué)本科讀的是哲學(xué)專(zhuān)業(yè),那您認(rèn)為哲學(xué)中有哪些部分是您可以應(yīng)用到計(jì)算機(jī)科學(xué)的研究中的。

  Leslie Kaelbling:哲學(xué)與計(jì)算機(jī)科學(xué)是緊密相關(guān)的。我在大學(xué)本科期間沒(méi)有讀計(jì)算機(jī)專(zhuān)業(yè)是因?yàn)樗固垢4髮W(xué)當(dāng)時(shí)還沒(méi)有開(kāi)設(shè)這個(gè)專(zhuān)業(yè),但是實(shí)際上,斯坦福大學(xué)開(kāi)設(shè)了一些特殊的輔修課程,比如現(xiàn)在稱(chēng)作符號(hào)系統(tǒng)(symbolic system)的學(xué)科,這門(mén)課程教授的內(nèi)容是邏輯模型理論(logic model theory)以及自然語(yǔ)言的形式語(yǔ)義(formal semantics of natural language)。這對(duì)于我之后從事 AI 和計(jì)算機(jī)科學(xué)的研究做了一個(gè)完美的鋪墊。

  Lex Fridman:這非常有意思。當(dāng)時(shí)如果對(duì) AI 感興趣的話,大家一般會(huì)選擇上哪些計(jì)算機(jī)相關(guān)課程?您當(dāng)時(shí)對(duì)于 AI 的想法深為著迷,除了哲學(xué),還源自于什么其他的原因?

  Leslie Kaelbling:當(dāng)時(shí)并沒(méi)有很多人從事這個(gè)方向的研究,甚至也沒(méi)有什么人探討它。但是我大學(xué)的同班同學(xué)倒是都對(duì)人工智能挺感興趣的:我們班有接近一半的人轉(zhuǎn)向計(jì)算機(jī)科學(xué)專(zhuān)業(yè)深造,近一半的轉(zhuǎn)向法律專(zhuān)業(yè)深造,而只有一兩位同學(xué)繼續(xù)留在哲學(xué)專(zhuān)業(yè)學(xué)習(xí)。所以哲學(xué)專(zhuān)業(yè)和計(jì)算機(jī)科學(xué)專(zhuān)業(yè)二者間其實(shí)是有相當(dāng)普遍的關(guān)聯(lián)性的。

  Lex Fridman:你認(rèn)為 AI 研究人員是否需要擁有哲學(xué)家的另一重身份,還是說(shuō)他們應(yīng)該堅(jiān)持從事「硬」的科學(xué)和工程研究,而不需要進(jìn)行一些哲學(xué)思考?也就是說(shuō),如果研究者從事于機(jī)器人研究,卻無(wú)法很好地從哲學(xué)上的大視角來(lái)看待研究問(wèn)題,又該用什么來(lái)驅(qū)動(dòng)他們研究出出色的 AI 呢?

  Leslie Kaelbling:我認(rèn)為哲學(xué)專(zhuān)業(yè)中與 AI 最緊密相關(guān)或者說(shuō)與 AI 有點(diǎn)關(guān)系的,就是信念、知識(shí)以及表示這些東西。這些其實(shí)都是非常形式化的東西,似乎距離我們所做的常規(guī)計(jì)算機(jī)科學(xué)工作只有一步之遙。我認(rèn)為現(xiàn)在非常重要的問(wèn)題依舊是,你可以用機(jī)器來(lái)做什么以及不能做什么。盡管我個(gè)人完全是一個(gè)唯物主義者,但我認(rèn)為我們沒(méi)有理由無(wú)法開(kāi)發(fā)出一個(gè)行為舉止與人類(lèi)毫無(wú)區(qū)別的機(jī)器人,而判斷它與人類(lèi)是否有區(qū)別的關(guān)鍵在于它的內(nèi)心是否是有直覺(jué)或哲學(xué)思維。實(shí)際上,我并不知道自己是否非常在意這個(gè)。

  但是我們現(xiàn)在不知道它們獲得哲學(xué)思維,進(jìn)行感知和規(guī)劃,以及在現(xiàn)實(shí)世界中順利運(yùn)行有多難。畢竟現(xiàn)在的機(jī)器人在很多任務(wù)上,都還做不到像人類(lèi)一樣。

  所以問(wèn)題實(shí)際上就是,現(xiàn)在機(jī)器人和人類(lèi)在哲學(xué)上還存在巨大的差距。我們都知道,如果機(jī)器人要在現(xiàn)實(shí)世界應(yīng)用這些知識(shí),就需要對(duì)這些知識(shí)進(jìn)行擴(kuò)展,并需要擁有形成常識(shí)以及在大部分工作中進(jìn)行不確定性推理的能力。這些都是開(kāi)放性的問(wèn)題,我不知道要怎樣去用確定而全面的視角看待這些問(wèn)題。

  對(duì)于我來(lái)說(shuō),這似乎并不是一個(gè)哲學(xué)差距的問(wèn)題,而是一個(gè)技術(shù)上的大難點(diǎn),除此之外,我并不認(rèn)為機(jī)器人和人類(lèi)在其他方面存在差距。

  Lex Fridman:好的。您是否認(rèn)為 AI 還存在一些遺憾呢?還記得當(dāng)您開(kāi)始對(duì)機(jī)器人學(xué)或機(jī)器人產(chǎn)生興趣的時(shí)候,當(dāng)時(shí)對(duì) Shaky 機(jī)器人有什么印象?您當(dāng)時(shí)對(duì)于機(jī)器人的想象是否實(shí)現(xiàn)了呢?

  Leslie Kaelbling:我最開(kāi)始研究的機(jī)器人是 Shaky,它是 SRI 研究人員開(kāi)發(fā)出來(lái)的機(jī)器人。當(dāng)我第一次踏入 SRI 的時(shí)候,當(dāng)時(shí)它正站在某個(gè)辦公室的角落,正在將液壓油滴在一個(gè)鍋中。這個(gè)機(jī)器人是相當(dāng)具有標(biāo)志性的,每個(gè)人都應(yīng)該讀到過(guò) Shaky 的技術(shù)報(bào)道,因?yàn)樗砩蠀R聚了許多非常好的想法,比如他們不僅將很好的搜索、符號(hào)規(guī)劃和學(xué)習(xí)的宏操作符都應(yīng)用到了機(jī)器人身上,還對(duì)機(jī)器人進(jìn)行了較初級(jí)的空間規(guī)劃配置,并且為 Shaky 配置上了手臂。他們?cè)诤芏喾矫娑加辛吮容^清晰的基本思路。

  Shaky 是一個(gè)移動(dòng)機(jī)器人,它可以推動(dòng)物體,在它自身搭載的執(zhí)行器和底座的幫助下,可以將物體移到旁邊去。同時(shí),它還能夠使用它的視覺(jué)去進(jìn)行自我定位、探測(cè)物體,并基于它所看到的東西進(jìn)行規(guī)劃,并推理是否要探視和拍照。我覺(jué)得,當(dāng)時(shí)它對(duì)我們現(xiàn)在所能想到的很多事情都有了基本的認(rèn)知。

  Lex Fridman:您認(rèn)為它是怎樣表示周?chē)沫h(huán)境空間的呢?

  Leslie Kaelbling:它對(duì)于許多不同程度的抽象表示都有認(rèn)知,我認(rèn)為,它對(duì)于低級(jí)別的抽象表示,會(huì)使用某種占用網(wǎng)格;對(duì)于高級(jí)別的抽像表示,它會(huì)使用針對(duì)某種空間以及關(guān)聯(lián)性的抽象符號(hào)。

  Lex Fridman:現(xiàn)在有一個(gè)詞叫「片狀」(flaky)。

  Leslie Kaelbling:是的。當(dāng)時(shí)在 SRI 的時(shí)候,我們正在開(kāi)發(fā)一個(gè)全新的機(jī)器人。正如我剛剛所說(shuō)的,團(tuán)隊(duì)中沒(méi)有一個(gè)人是來(lái)自于之前 Shaky 那個(gè)項(xiàng)目的,因此我們相當(dāng)于是從頭開(kāi)始。當(dāng)時(shí)是我的導(dǎo)師并最終也成為了我的論文導(dǎo)師的 Stanresinshine,就曾受到「情景計(jì)算」(Situated Computation)或者說(shuō)「情境自動(dòng)裝置」(Situated Automata)這個(gè)想法的啟發(fā)。這個(gè)想法就是:邏輯推理的工具非常重要,但是可能僅有工程師或者設(shè)計(jì)者會(huì)將這個(gè)工具用到系統(tǒng)的分析中,此外,這一工具不一定要應(yīng)用到系統(tǒng)自身的頭部中。

  當(dāng)時(shí)我認(rèn)為可以使用邏輯去證明關(guān)于機(jī)器人行為的理論:即使機(jī)器人不使用它頭部的邏輯,它也可以進(jìn)行手臂的動(dòng)作。這就是區(qū)別。而這個(gè)想法就是使用這些原則去開(kāi)發(fā)可以做事情的機(jī)器人。不過(guò)當(dāng)時(shí),我自己需要學(xué)習(xí)大量的基礎(chǔ)工作,因?yàn)槲覜](méi)有機(jī)器人學(xué)背景,不知道任何機(jī)器控制、感知相關(guān)的知識(shí)。所以在這一過(guò)程中,我們把很多技術(shù)都重新研發(fā)了一遍。

  Lex Fridman:那您認(rèn)為這是優(yōu)勢(shì)還是阻力呢?

  Leslie Kaelbling:我的意思是說(shuō),在這個(gè)過(guò)程中,你可以學(xué)到很多事情,并且最終攻克問(wèn)題以后也能更清楚地明白自己走到了哪一步。

  Lex Fridman:您能總結(jié)一下 AI 和機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí)的歷史,以及您怎樣看待它從 20 世紀(jì) 50 年代至今的發(fā)展?

  Leslie Kaelbling:它的發(fā)展的一個(gè)重要特點(diǎn)就是徘徊:變得火熱之后又落到低谷,之后又變得受歡迎,隨后又落到低谷...... 實(shí)際上,我認(rèn)為它的進(jìn)程很大程度上是由社會(huì)學(xué)進(jìn)程所驅(qū)動(dòng)的。

  早期,它的發(fā)展是控制論的發(fā)展有關(guān),人們以動(dòng)態(tài)平衡的思路開(kāi)發(fā)機(jī)器人,當(dāng)機(jī)器人需要?jiǎng)幽艿臅r(shí)候,就為它們充電,之后它們就可以在周?chē)鷿L動(dòng),做事情。后來(lái),我對(duì)于這一思路思考了很長(zhǎng)時(shí)間,我認(rèn)為它是具有啟發(fā)性的。但是當(dāng)時(shí)人們不贊成這一思路,他們認(rèn)為我們需要讓機(jī)器人不斷接近實(shí)現(xiàn)真的智能,即類(lèi)人智能。

  之后人們嘗試研究專(zhuān)家系統(tǒng)去實(shí)現(xiàn)真正的智能,但是都太過(guò)表面了。我們對(duì)智能的理解是表面的,這就跟我們理解鋼鐵廠怎么運(yùn)轉(zhuǎn)一樣。我們認(rèn)為,只要對(duì)智能進(jìn)行解釋?zhuān)缓髮⑺眠壿媽?xiě)下來(lái),之后再設(shè)計(jì)一臺(tái)計(jì)算機(jī)來(lái)對(duì)其進(jìn)行推理就實(shí)現(xiàn)了專(zhuān)家系統(tǒng),然而結(jié)果,我們發(fā)現(xiàn)計(jì)算機(jī)無(wú)法實(shí)現(xiàn)推理。不過(guò)我認(rèn)為比較有意思的是,當(dāng)專(zhuān)家系統(tǒng)的研究開(kāi)始變得不太順利時(shí),我們不僅改變了研究方法,我們還改變了問(wèn)題。我們似乎沒(méi)有更好地方法甚至可以說(shuō)沒(méi)有辦法去解決專(zhuān)家系統(tǒng)的問(wèn)題。最終我們放棄去解決專(zhuān)家系統(tǒng)的問(wèn)題,開(kāi)始轉(zhuǎn)向另一個(gè)完全不同的問(wèn)題。

  Lex Fridman:想必當(dāng)時(shí)研究界有很多人會(huì)認(rèn)為不應(yīng)該放棄專(zhuān)家系統(tǒng)的研究,而您則傾向于將該問(wèn)題先擱置到一邊。現(xiàn)在讓我們回到剛剛的話題,專(zhuān)家系統(tǒng)之后的 20 年的發(fā)展。

  Leslie Kaelbling:認(rèn)為專(zhuān)家系統(tǒng)很異常,這個(gè)觀點(diǎn)是無(wú)可厚非的,這就像有的人認(rèn)為僅僅做一些表面的符號(hào)推理是錯(cuò)誤的一樣,以及有些人認(rèn)為醫(yī)生在擁有臨床經(jīng)驗(yàn)之前不能成為一名真正的醫(yī)生一樣。因此當(dāng)時(shí)存在這個(gè)問(wèn)題的方向?qū)虿粚?duì)的爭(zhēng)論,都是正常的,只不過(guò)我們最終還是無(wú)法找到解決方法。

  Lex Fridman:您剛剛提到,邏輯學(xué)和符號(hào)系統(tǒng)中你最喜歡的部分,就是它們能夠給以短名稱(chēng)給大規(guī)模的設(shè)置命名。所以這些方面在符號(hào)推理中有什么應(yīng)用嗎,比如說(shuō)專(zhuān)家系統(tǒng)或符號(hào)計(jì)算?你認(rèn)為在 80 和 90 年代,人工智能發(fā)展的最大阻礙是什么?

  Leslie Kaelbling:實(shí)際上我并不是專(zhuān)家系統(tǒng)的擁護(hù)者,不過(guò)我對(duì)一些符號(hào)推理倒是很感興趣。說(shuō)到人工智能發(fā)展的阻礙,我認(rèn)為最主要的阻礙是當(dāng)時(shí)人們的想法,大家認(rèn)為人類(lèi)能夠有效地將他們的知識(shí)轉(zhuǎn)成某種形式的邏輯陳述。

  Lex Fridman:這不僅僅要求付出代價(jià)和努力,還要人類(lèi)真正擁有這種能力。

  Leslie Kaelbling:是的。雖然我們都算是有遠(yuǎn)見(jiàn)的專(zhuān)家,但是完全無(wú)法用內(nèi)省的方式來(lái)想明白我們?nèi)绾巫龅竭@一點(diǎn)。關(guān)于這一點(diǎn),我認(rèn)為其實(shí)當(dāng)時(shí)每個(gè)人都明白:專(zhuān)家系統(tǒng)不是要求人類(lèi)寫(xiě)下用來(lái)識(shí)別水瓶的規(guī)則,而是要寫(xiě)下用來(lái)進(jìn)行決策的規(guī)則。我認(rèn)為當(dāng)時(shí)大家都發(fā)現(xiàn)了,所謂的專(zhuān)家能給出的解釋?zhuān)拖聱椗赡軌蚪忉屗麄冊(cè)鯓幼鍪乱约盀楹巫鍪乱粯?。他們給出的解釋不一定很好。

  之后,他們改造了專(zhuān)家系統(tǒng),使其轉(zhuǎn)而依賴(lài)于某種感知事物的東西,但是感知的這種東西又回到了我們剛剛提到的:我們無(wú)法很好地定義它們。所以從根本上來(lái)說(shuō),我認(rèn)為其根本問(wèn)題就是假設(shè)人們可以明確表達(dá)他們做決策的方式和原因。

  Lex Fridman:所以說(shuō),從專(zhuān)家那里轉(zhuǎn)換而來(lái)的知識(shí)進(jìn)行編碼后,就變成了機(jī)器能夠理解和推理的東西。

  Leslie Kaelbling:并不是。這不僅僅需要編碼,還需要讓知識(shí)完全脫離專(zhuān)家。我的意思是,將知識(shí)編寫(xiě)到計(jì)算機(jī)中本來(lái)就很難。而我更認(rèn)為,人們無(wú)法將這些知識(shí)生成出來(lái)。人們可以講一個(gè)故事告訴我為什么要做這件事,但我并不確定這樣表達(dá)出來(lái)的東西能夠?yàn)闄C(jī)器所理解。

  Lex Fridman:在分層規(guī)劃方面仍然存在符號(hào)推理的用武之地,正如您剛才所談到的那樣。所以具體的難點(diǎn)在哪里呢?

  Leslie Kaelbling:即便人類(lèi)不能為機(jī)器提供推理過(guò)程的描述,這也并不意味著在計(jì)算機(jī)內(nèi)部不能進(jìn)行各類(lèi)風(fēng)格的推理。這只是兩個(gè)正交點(diǎn)(Orthogonal Points)。這樣的話,問(wèn)題實(shí)際上就變成了:應(yīng)該在計(jì)算機(jī)內(nèi)部用何種方式進(jìn)行推理?答案是,我認(rèn)為計(jì)算機(jī)內(nèi)部需要針對(duì)所面臨的不同問(wèn)題,使用各種不同的推理方式。

  Lex Fridman:我是否可以理解為,這個(gè)問(wèn)題是,人們可以對(duì)哪類(lèi)事物進(jìn)行符號(hào)編碼,從而實(shí)現(xiàn)推理?

  Leslie Kaelbling:關(guān)于符號(hào),我甚至都不喜歡這個(gè)術(shù)語(yǔ),因?yàn)槲也恢浪诩夹g(shù)上和形式上到底是什么意思,與此同時(shí),我對(duì)抽象深信不疑。抽象是直觀、重要的,因?yàn)閷?duì)于生活中的一切,人不可能從特別細(xì)的粒度出發(fā)做出完整的推理。你不可能僅僅基于某張圖像,就做出要讀博士的決策。

  所以如果你要推理出要攻讀博士學(xué)位,甚至是購(gòu)買(mǎi)哪些食材來(lái)做晚餐,你就必須縮小狀態(tài)空間的大小以及推理的視界。那該怎樣縮小狀態(tài)空間的大小或推理的視界?答案是抽象:空間抽象和時(shí)間抽象。

  我認(rèn)為沿著目標(biāo)軸線的抽象也很有趣,對(duì)目標(biāo)進(jìn)行抽象和分解可能更像是一個(gè)分解的過(guò)程,某種程度上我認(rèn)為這就是大家所謂的符號(hào)或離散模型。當(dāng)你在聊天的時(shí)候,你可能會(huì)談到房子的面積,而不會(huì)談你在某個(gè)時(shí)間點(diǎn)的姿勢(shì);你會(huì)說(shuō)你在下午做了某件事,而不會(huì)說(shuō)你在兩點(diǎn)五十四分做了某件事情。你這樣做其實(shí)是因?yàn)檫@樣能簡(jiǎn)化了你的推理問(wèn)題,以及你沒(méi)有足夠的信息去對(duì)你在今天下午兩點(diǎn)五十四分的姿勢(shì)進(jìn)行高保真的推理。

  我需要重點(diǎn)重申的一點(diǎn)是,所有的這些都不應(yīng)該淪為教條,認(rèn)為我們不應(yīng)該這樣做,不應(yīng)該那樣做。我可以贊成符號(hào)推理,而你也可以支持神經(jīng)網(wǎng)絡(luò)。計(jì)算機(jī)科學(xué)最終會(huì)告訴我們所有這些問(wèn)題的正確答案是什么,如果我們夠聰明的話,也可以搞清楚。

  Lex Fridman:是的,實(shí)際上當(dāng)你試圖用計(jì)算機(jī)解決實(shí)際問(wèn)題時(shí),正確答案自然而然就出來(lái)了。您剛剛提到抽象這個(gè)概念,提到所有的網(wǎng)絡(luò)都源自于抽象,存在自動(dòng)化的方式去形成策略、專(zhuān)家驅(qū)動(dòng)的方法去構(gòu)建抽象,并且當(dāng)下人類(lèi)似乎在抽象構(gòu)建上的表現(xiàn)更好,所以你提到兩點(diǎn)五十四分與下午對(duì)比,那我們?nèi)绾螛?gòu)建這樣的分類(lèi)法呢?現(xiàn)在是否有可能實(shí)現(xiàn)諸如抽象此類(lèi)的自動(dòng)構(gòu)建?

  Leslie Kaelbling:我認(rèn)為當(dāng)機(jī)器學(xué)習(xí)發(fā)展得更好時(shí),工程師可以開(kāi)發(fā)出算法來(lái)構(gòu)建出非常出色的抽象。

  Lex Fridman:我們不妨先放下抽象的討論,先談?wù)劜糠挚捎^察的馬爾可夫決策過(guò)程(Partially Observable Markov Decision Processes,POMDPs)。首先想請(qǐng)問(wèn)一下您,什么是馬爾可夫決策過(guò)程?我們世界中有多少事物是可以建模以及具有馬爾可夫決策過(guò)程的。比如您從 POMDPs 的角度,怎樣看待早晨做早餐的花費(fèi)?又怎樣看待 POMDPs?它跟我們的真實(shí)世界又是怎樣建立聯(lián)系的?

  Leslie Kaelbling:其實(shí)這是一個(gè)立場(chǎng)問(wèn)題,立場(chǎng)就是我看待問(wèn)題所處的位置。我作為一名研究人員或者系統(tǒng)設(shè)計(jì)者,可以選擇以何種方式對(duì)我周?chē)氖澜缃⒛P?,從而了解這個(gè)混亂的世界。如果我其將當(dāng)做這種形式的問(wèn)題處理,我就可以沿著算法這一類(lèi)的思路,提出方案來(lái)解決問(wèn)題。當(dāng)然對(duì)這個(gè)世界建模并不能代表能解決任何問(wèn)題,也不是馬爾可夫決策過(guò)程。但是我能通過(guò)以各種方式建模的來(lái)尋找解決方案,一旦我找到正確的建模方式,就能得到一些可以用的算法。

  Lex Fridman:您可以通過(guò)各種方式為這個(gè)世界建模。一些方式會(huì)更傾向于接受不確定性,也更容易為世界的不確定性進(jìn)行建模,而一些方式可能會(huì)強(qiáng)行將這個(gè)世界變成確定性的。

  Leslie Kaelbling:是的。一些模型是不確定性的,但是這個(gè)模型并不能表示當(dāng)前狀態(tài)的不確定性,而是對(duì)未來(lái)的發(fā)展走勢(shì)進(jìn)行建模。

  Lex Fridman:那什么是馬爾可夫決策過(guò)程呢?

  Leslie Kaelbling:馬爾可夫決策過(guò)程,是一個(gè)假設(shè)我能夠完全了解系統(tǒng)的當(dāng)前狀態(tài),即掌握系統(tǒng)的所有信息情況下對(duì)未來(lái)做預(yù)測(cè)的模型。所以記住歷史發(fā)生的所有事情,與對(duì)未來(lái)所做預(yù)測(cè)的好壞并無(wú)關(guān)聯(lián)。同時(shí),該模型也假設(shè)我能夠采取一些行動(dòng)來(lái)改變世界的當(dāng)前狀態(tài),并且我無(wú)法對(duì)這些變化進(jìn)行確定性建模,而只能建立概率模型。這種概率模型對(duì)于某些系統(tǒng)來(lái)說(shuō)可能非常有用,不過(guò)對(duì)于大多數(shù)問(wèn)題來(lái)說(shuō)都沒(méi)什么用。因?yàn)閷?duì)于大多數(shù)問(wèn)題,你無(wú)法只能觀察到它們的部分狀態(tài),并且這些問(wèn)題都是各不相同的。

  Lex Fridman:所以對(duì)于馬爾可夫決策過(guò)程,我們只能觀察到部分狀態(tài)。所以當(dāng)你不能觀察到大部分狀態(tài),也不能完整地了解周邊世界的信息時(shí),馬爾可夫決策過(guò)程又怎樣處理現(xiàn)實(shí)問(wèn)題呢?

  Leslie Kaelbling:現(xiàn)在這個(gè)過(guò)程的思路依舊是,假設(shè)存在我們了解周?chē)澜绲囊恍┬畔⒌那闆r,我們能夠做出好的預(yù)測(cè)。雖然我們不知道當(dāng)前完整的狀態(tài),不過(guò)我們可以通過(guò)圖像等去觀察、感受,然后根據(jù)觀察到的歷史行為去推斷世界的發(fā)展趨勢(shì),并基于自己無(wú)法確定的未來(lái)發(fā)展動(dòng)向,來(lái)決定采取什么行動(dòng)。

  Lex Fridman:在不確定的情況下做出規(guī)劃,這個(gè)問(wèn)題是非常困難的。在對(duì)世界進(jìn)行建模來(lái)處理現(xiàn)實(shí)世界這種特殊系統(tǒng)的不確定性方面,您有著非常豐富的經(jīng)驗(yàn)。

  Leslie Kaelbling:這種最優(yōu)規(guī)劃問(wèn)題往往是不可判定的,它取決于你進(jìn)行了怎樣的設(shè)置。很多人都表示,我不使用 POMDPs,因?yàn)樗鼈冸y以處理。我個(gè)人認(rèn)為這是一件非?;氖虑?,因?yàn)閱?wèn)題之所叫做問(wèn)題,就是需要你必須去解決的。

  而我們 AI 研究者之所以會(huì)出現(xiàn),就是因?yàn)橐鉀Q的問(wèn)題非常棘手。我們都明白我們正在解決的問(wèn)題在計(jì)算上的難度非常高,我們可能無(wú)法為它找到最優(yōu)解。即便我們認(rèn)為可能無(wú)法提出最佳解決方案,但是還是會(huì)回到最優(yōu)問(wèn)題上反復(fù)探索,我們能做的就是讓建模、算法不斷、不斷地接近最優(yōu)。

  我從來(lái)不會(huì)說(shuō),問(wèn)題的計(jì)算是多么復(fù)雜。相反地,這些復(fù)雜的問(wèn)題能夠讓我更清晰地了解我解決問(wèn)題的方式,然后一步步地執(zhí)行近似操作,最終在一個(gè)合理的時(shí)間范圍內(nèi)找到可計(jì)算的最優(yōu)解。

  Lex Fridman:當(dāng)您在探討最優(yōu)解的時(shí)候,當(dāng)時(shí)業(yè)界有多重視追求最優(yōu)解決方案的思想?此外,追求最佳解決方案的思想多年來(lái)也一直在變化。

  Leslie Kaelbling:這很有趣,從理論上來(lái)說(shuō),我們實(shí)際上有一點(diǎn)方法論危機(jī)。我的意思是,我認(rèn)為理論對(duì)于我們現(xiàn)在所做的很多事情都很重要。

  現(xiàn)在出現(xiàn)了很多經(jīng)驗(yàn)豐富的黑客攻擊,他們對(duì)此進(jìn)行訓(xùn)練并進(jìn)行編號(hào)。我們很難說(shuō)清這樣好還是不好。如果你關(guān)注計(jì)算機(jī)科學(xué)理論,你會(huì)發(fā)現(xiàn)在談?wù)摿颂接懸欢螘r(shí)間后,每個(gè)人都會(huì)討論最優(yōu)化解決問(wèn)題。人們會(huì)關(guān)注怎樣找到遺憾綁定(Regret Bound)、怎樣執(zhí)行近似、怎樣證明問(wèn)題的解是近似解,花的時(shí)間越多就越接近最終的最優(yōu)解。

  我覺(jué)的比較有意思的是,對(duì)于難度非常高的問(wèn)題,我們沒(méi)有建立一個(gè)比較好的「近似解」概念。我個(gè)人非常喜歡研究難度很高的問(wèn)題,希望自己建立某種形式的解決方案的概念,讓我可以判斷這個(gè)算法是有一定作用的,讓我知道除了運(yùn)行它還能用它做點(diǎn)其他什么事情。

  Lex Fridman:所以擁有某種概念某種程度上對(duì)您有很深的吸引力,同時(shí)您可以使用這些概念來(lái)更好地看清某些事情,并期待這些事情能夠給您帶來(lái)好的結(jié)果。

  Leslie Kaelbling:科學(xué)這一學(xué)科中也有工程學(xué),但我認(rèn)為二者并不完全相同。我認(rèn)為我們正在做的工程學(xué)取得了跨越式的發(fā)展,它是走在科學(xué)前頭的學(xué)科。但是它今后如何發(fā)展,大致是怎樣以及為什么工作,沒(méi)有人清楚。我們需要將工程問(wèn)題轉(zhuǎn)化成科學(xué)問(wèn)題,我們需要知道工程學(xué)怎樣、為什么工作的原理,比如在曾經(jīng)的一段時(shí)間,人們?nèi)绻蛄壕鸵嬲厝ソ?,而現(xiàn)在我們不需要去真正去建橋梁,就能預(yù)測(cè)這架橋梁建成后會(huì)是什么樣。這些都是我們可以應(yīng)用到學(xué)習(xí)系統(tǒng)以及機(jī)器人中的。

  Lex Fridman:您期望從唯物主義的角度來(lái)看待人工智能、智能系統(tǒng)以及機(jī)器人? MDPs 所涉及的信念空間(Belief Space)和狀態(tài)空間(State Space)有什么區(qū)別?您通過(guò)世界的狀態(tài)來(lái)進(jìn)行推理,那信念空間呢?

  Leslie Kaelbling:信念空間不是說(shuō)考慮當(dāng)前世界的狀態(tài)是什么樣的從而嘗試讓機(jī)器人去控制這些狀態(tài),我將它理解為一種世界如何發(fā)展的概率分布,這樣的話控制問(wèn)題不再是怎樣控制機(jī)器人在這個(gè)世界穿行的問(wèn)題,而變成了一個(gè)控制信念的問(wèn)題,即我采取行動(dòng)不僅僅考慮這個(gè)行為對(duì)真實(shí)世界產(chǎn)生什么影響,還會(huì)考慮它對(duì)于我自己對(duì)世界的理解會(huì)產(chǎn)生什么影響。這就可能迫使我提出一個(gè)問(wèn)題:哪些是不會(huì)真正改變世界狀態(tài)但會(huì)改變我對(duì)世界的信念的?我會(huì)將這些信息匯集起來(lái)作為決策考量的依據(jù)。

  Lex Fridman:這是增強(qiáng)智能體對(duì)世界的推理和探索能力的很強(qiáng)大的方法。您在面臨什么問(wèn)題的時(shí)候,會(huì)考慮用到信念空間,又在什么情況下會(huì)僅僅考慮狀態(tài)空間呢?

  Leslie Kaelbling:其實(shí)大部分問(wèn)題都是需要刻意收集信息的。在一些問(wèn)題中,比如說(shuō)象棋中是不存在不確定性的,但是對(duì)于對(duì)手來(lái)說(shuō),可能就會(huì)存在不確定性,這樣的話就不存在狀態(tài)的不確定性了。即便一些問(wèn)題存在不確定性,但是你可以在解決問(wèn)題的過(guò)程中去收集信息。比如,當(dāng)你乘坐駕駛自動(dòng)汽車(chē)的時(shí)候,它并不完全知道它身處何處,但它了解光照時(shí)長(zhǎng)一直在變化的信息,這個(gè)時(shí)候你是不需要收集信息的;但是當(dāng)你自己在道路上駕駛汽車(chē)時(shí),你要看看你旁邊以及后方的路況,需要決定在哪邊道路開(kāi)等等,你需要衡量這些信息的價(jià)值,并選擇收集哪些信息以及合理區(qū)分。

  同時(shí),在你采取行動(dòng)前,你還需要考慮自身的不確定性。如果我知道我所站的地方與門(mén)框恰好相對(duì),我就能順利穿過(guò)門(mén)。但是如果我不能確定門(mén)所在的位置,最好就不要馬上邁過(guò)去,而要先進(jìn)行評(píng)估。

  Lex Fridman:你對(duì)世界的不確定程度,實(shí)際上就是你在形成規(guī)劃過(guò)程中需要優(yōu)化的一部分。那您能否描述一下,我們?cè)鯓硬捎梅謱右?guī)劃的方式來(lái)對(duì)這個(gè)世界做規(guī)劃?距離機(jī)器人真正實(shí)現(xiàn)對(duì)一些事情做規(guī)劃還有一段很長(zhǎng)的道路。

  Leslie Kaelbling:推理中使用的分層推理,包括時(shí)間分層和空間分層。我們先說(shuō)一下時(shí)間分層。之前的執(zhí)行過(guò)程需要進(jìn)行很長(zhǎng)時(shí)間,而使用時(shí)間分層就能夠抽象地將這個(gè)過(guò)程劃分為幾個(gè)部分。在之前我們也談到過(guò),如果你能夠在狀態(tài)空間中構(gòu)建時(shí)間抽象,你就能進(jìn)行高水平的規(guī)劃,比如說(shuō)我要前往城鎮(zhèn),然后給車(chē)加油,之后我會(huì)到這里做一些什么事情等等。你可以推理出這些行為的依賴(lài)性和約束性,而不需要進(jìn)行事無(wú)巨細(xì)的考量。

  在分層規(guī)劃中,我們需要做的就是針對(duì)抽象,做出高水平的規(guī)劃。我認(rèn)為這個(gè)過(guò)程是非常靈活的,它不需要考量所有的細(xì)節(jié)因素,同時(shí)我也認(rèn)為這是非常有趣的一個(gè)步驟。我喜歡以機(jī)場(chǎng)這一場(chǎng)景為例,比如你可以規(guī)劃前往紐約,之后到達(dá)目的機(jī)場(chǎng),然后到達(dá)辦公樓,但是你無(wú)法提前說(shuō)出你在機(jī)場(chǎng)發(fā)生的事情,這或許是因?yàn)槟阕约簯械孟?,但更多的還是因?yàn)槟銢](méi)有足夠的信息推理出你在哪個(gè)登機(jī)口登機(jī),坐在你前面的是誰(shuí)等等這些事情。

  所以,規(guī)劃得太詳細(xì)是沒(méi)有意義的,但是你必須實(shí)現(xiàn)信念上的飛躍,相信你到了那里就能弄清楚所有事情。有人說(shuō),我終其一生所學(xué)到的就是預(yù)測(cè)實(shí)現(xiàn)某些文憑的子目標(biāo)的難度。我認(rèn)為這是至關(guān)重要的,如果你對(duì)于完成這些中間步驟沒(méi)有一個(gè)模型,你就無(wú)法對(duì)飛往某個(gè)地方做規(guī)劃。

  我們現(xiàn)在要討論的一件事就是,就是如何對(duì)這些你沒(méi)有經(jīng)歷過(guò)的情況進(jìn)行概括,從而進(jìn)行預(yù)測(cè),比如說(shuō)穿過(guò)吉隆坡機(jī)場(chǎng)要多長(zhǎng)時(shí)間。所以,對(duì)于這類(lèi)抽象模型,我真的非常感興趣,一旦我們創(chuàng)建好這些模型,我們就可以用這些模型來(lái)做分層推理,我認(rèn)為這非常重要。

  Lex Fridman:就跟您剛剛提到,一旦你出現(xiàn)在機(jī)場(chǎng),你就離目標(biāo)只剩幾步之遙了。您能解釋一下這個(gè)目標(biāo)的起點(diǎn)是什么嗎?

  Leslie Kaelbling:Herb Simon 在人工智能早期就談到過(guò)從方法到結(jié)果的正向推理以及從結(jié)果出發(fā)的反向推理。人們直覺(jué)上會(huì)認(rèn)為狀態(tài)空間數(shù)量很多,你可以采取的行為也很多。比如說(shuō)我坐著的時(shí)候,想要搜索我前面在哪,我所有能做的事情是什么,其狀態(tài)空間和可采取的行為數(shù)量都是龐大的。

  如果你可以在另一個(gè)層面上推理,比如確定了希望實(shí)現(xiàn)的目標(biāo),要知道如何實(shí)現(xiàn)這一目標(biāo),這樣問(wèn)題的范圍就更小了。有趣的是,現(xiàn)在 AI 規(guī)劃領(lǐng)域還沒(méi)有解決已知的這類(lèi)問(wèn)題,并且他們現(xiàn)在傾向于使用的方法還是從方法到結(jié)果的正向推理,目前還沒(méi)有什么研究在從結(jié)果出發(fā)的反向推理中做出更好的結(jié)果。這還是我的某種直覺(jué),我還無(wú)法立即向你證明這一點(diǎn)。

  Lex Fridman:也很榮幸您能跟我們分享您的直覺(jué)。您之前是否思考 AI 領(lǐng)域需要借助點(diǎn)哲學(xué)的智慧?您認(rèn)為將人類(lèi)的一生或生命的某個(gè)部分制定成一個(gè)規(guī)劃問(wèn)題有多難?當(dāng)您從事于機(jī)器人研究時(shí),您往往考慮的是物體操作、物體移動(dòng)任務(wù)等,那您打算什么時(shí)候走出實(shí)驗(yàn)室,讓機(jī)器人出門(mén)、做午飯以及追求更加高遠(yuǎn)的目標(biāo)呢?您怎樣看待這個(gè)問(wèn)題?

  Leslie Kaelbling:我認(rèn)為這個(gè)想法是錯(cuò)誤的,事實(shí)上人類(lèi)的一生并不都是規(guī)劃問(wèn)題。大家可能都覺(jué)得將生活的各個(gè)部分整合在一起非常重要,但是這些部分在推理、表示以及學(xué)方面的風(fēng)格都是截然不同的。大家都清楚的是,一個(gè)人不可能永遠(yuǎn)都是這樣的或者那樣的,人類(lèi)的大腦也并不總是一成不變,所有的事情都是如此,它們的構(gòu)成部分、子架構(gòu)等都不盡相同。所以我個(gè)人認(rèn)為,我們沒(méi)理由去憧憬,將會(huì)有一個(gè)算法能夠真正地完成整個(gè)任務(wù)。

  Lex Fridman:我們現(xiàn)在能做的,還只是針對(duì)特定的問(wèn)題設(shè)計(jì)出特定的算法。

  Leslie Kaelbling:這需要考量問(wèn)題類(lèi)型,比如說(shuō),某些推理可能需要在圖像空間中進(jìn)行。我要再次提到的一點(diǎn)事,推理只是一個(gè)強(qiáng)化學(xué)習(xí)問(wèn)題,它的思路可以是基于模型的,也可以是不基于模型的。人們可能還在談?wù)撌欠駪?yīng)該學(xué)習(xí)——我們可以學(xué)習(xí)策略直接產(chǎn)生行為,也可以學(xué)習(xí)一個(gè)客觀的價(jià)值函數(shù),或者學(xué)習(xí)一個(gè)轉(zhuǎn)移模型以及某些能夠告知我們世界動(dòng)態(tài)信息的東西。比如當(dāng)我旅游的時(shí)候,想象我學(xué)到了一個(gè)轉(zhuǎn)移模型,將它與規(guī)劃器結(jié)合起來(lái),然后畫(huà)出一個(gè)圍繞它的盒子,我就可以學(xué)到一個(gè)策略,而這個(gè)策略是以不同的方式儲(chǔ)存的。與其他策略一樣,它也僅僅是一個(gè)策略。

  而我更傾向于將其視為一種在計(jì)算上的時(shí)空權(quán)衡。一方面,對(duì)于更公開(kāi)的策略表示,它可能需要占據(jù)更多的空間,但是我可以快速地計(jì)算出應(yīng)該采取的行為;另一方面,使用一個(gè)非常緊湊的世界動(dòng)態(tài)模型加上一個(gè)計(jì)劃器,我可能只能比較慢地計(jì)算出接下來(lái)要采取的行為。我認(rèn)為這一點(diǎn)不存在任何爭(zhēng)議,它只是一個(gè)「對(duì)于我們來(lái)說(shuō),哪種計(jì)算形式最好」的問(wèn)題。

  比如用代數(shù)操作做某些推理是合適的,但是如果面對(duì)的是控制騎獨(dú)輪車(chē)這樣的任務(wù),它對(duì)時(shí)間響應(yīng)的要求很高,但是決策空間也要小很多,在這種時(shí)候可能我們就需要不同的表示方式。隨便舉的例子,不一定貼切。

  Lex Fridman:您認(rèn)為感知和規(guī)劃哪個(gè)的難度系數(shù)更高?您如何看待通過(guò)了解周?chē)氖澜鐏?lái)實(shí)現(xiàn)感知?

  Leslie Kaelbling:我認(rèn)為一個(gè)重要的問(wèn)題是表示。近來(lái),感知取得了很大的進(jìn)展,我們可以用來(lái)分類(lèi)圖像,玩某些類(lèi)型的游戲或者將其應(yīng)用到駕駛汽車(chē)等等。我認(rèn)為,我們對(duì)于應(yīng)該提供怎樣的感知還沒(méi)有很好的思路。

  關(guān)于模塊化,現(xiàn)在有一個(gè)很強(qiáng)烈的觀點(diǎn)表示,我們不應(yīng)該創(chuàng)建任何模塊化,而應(yīng)該創(chuàng)建一個(gè)巨型神經(jīng)網(wǎng)絡(luò),并對(duì)它進(jìn)行端到端地訓(xùn)練使其完成任務(wù),這才是向前發(fā)展的最佳方式。這個(gè)觀點(diǎn)很難反駁,除非在樣本復(fù)雜性的基礎(chǔ)上,你或許可以說(shuō),如果想要在在這個(gè)巨型神經(jīng)網(wǎng)絡(luò)上實(shí)現(xiàn)強(qiáng)化學(xué)習(xí),就需要大量的數(shù)據(jù)以及許多類(lèi)似損壞的機(jī)器人系統(tǒng)等。

  對(duì)此也僅有唯一一個(gè)答案:我們需要在里面構(gòu)建一些東西(才能降低樣本復(fù)雜性的需求),比如構(gòu)建一些結(jié)構(gòu)、構(gòu)建一些偏倚。從機(jī)器學(xué)習(xí)理論上來(lái)看,降低樣本復(fù)雜性的唯一方法就是以某種方式縮小假設(shè)空間——這可以通過(guò)內(nèi)部的偏見(jiàn)來(lái)實(shí)現(xiàn)。我們有各種各樣的理由認(rèn)為,自然界為人類(lèi)內(nèi)置了偏見(jiàn)。而卷積就是一種偏見(jiàn),一種非常強(qiáng)烈、具有批判性的偏見(jiàn)。

  所以我個(gè)人認(rèn)為,我們需要尋找更多像卷積一樣,并且還能夠解決其他方面的推理問(wèn)題的東西。在與成像非常相似的空間推理等問(wèn)題上,卷積給我們帶來(lái)了很大的幫助。我認(rèn)為,類(lèi)似的其他想法,例如向前搜索、抽象概念以及目標(biāo)等的存在都是非常重要的,但是人們往往不給這些想法萌芽的機(jī)會(huì)。

  Lex Fridman:目標(biāo)語(yǔ)義、目標(biāo)空間中的類(lèi)似于卷積的想法?

  Leslie Kaelbling:是的,人們開(kāi)始研究的圖卷積就是與一種關(guān)系表征相關(guān)的想法。我認(rèn)為對(duì)于感知,研究者們接下來(lái)要實(shí)現(xiàn)的就是更好地理解感知是如何產(chǎn)生的。之后,我們才能更好地知道要對(duì)輸出做什么。但我們僅僅試圖去創(chuàng)建一個(gè)集成智能體,而實(shí)際上并不清楚感知的輸出應(yīng)該是什么,也不知道這些輸出怎樣和其他東西掛上鉤。因此,我認(rèn)為現(xiàn)在迫在眉睫的問(wèn)題就是,我們能夠創(chuàng)建什么樣的架構(gòu),比如另一個(gè)能像卷積網(wǎng)絡(luò)那樣允許我們?cè)谏厦鎸?shí)現(xiàn)高效學(xué)習(xí)的真正非常厲害的架構(gòu)。

  Lex Fridman:您對(duì)于感知目前的發(fā)展現(xiàn)狀令人信服的描述,我也贊成。您在教授一門(mén)關(guān)于智慧的集成的課程,那您認(rèn)為怎樣才能創(chuàng)建擁有人類(lèi)智能水平的機(jī)器人?

  Leslie Kaelbling:我不清楚我們到底是否知道該怎樣創(chuàng)建這樣一個(gè)機(jī)器人。

  Lex Fridman:那您認(rèn)為機(jī)器人需要擁有自我意識(shí)、知覺(jué)、倫理道德嗎?

  Leslie Kaelbling:我沒(méi)怎么考慮過(guò)機(jī)器人是否需要知覺(jué)這一問(wèn)題,即便是大多數(shù)關(guān)注這個(gè)的哲學(xué)家都知道,我們可以擁有行為表現(xiàn)像人類(lèi)但沒(méi)有知覺(jué)的僵尸機(jī)器人。在這個(gè)時(shí)候,我們會(huì)慶幸并不關(guān)心這個(gè)方面的問(wèn)題。

  Lex Fridman:您是否有從技術(shù)角度來(lái)思考過(guò)自我意識(shí)對(duì)于機(jī)器人的作用?

  Leslie Kaelbling:但是自我意識(shí)到底意味著什么呢?你需要實(shí)現(xiàn)的是讓某些系統(tǒng)的部分觀察系統(tǒng)的其他部分,然后告知我們是否運(yùn)行良好,這是很關(guān)鍵的。它們是否具有自我意識(shí),則取決于我們給「擁有自我意識(shí)」設(shè)定了怎樣的標(biāo)準(zhǔn)。但顯然,比如說(shuō)某行代碼計(jì)算出程序執(zhí)行的次數(shù),這其實(shí)也是一種自我意識(shí)。所以這里的邊界挺模糊的,可以要求很高、也可以要求很低,我們還在摸索一個(gè)合理的標(biāo)準(zhǔn)。

  Lex Fridman:您在很多維度上都了解得很長(zhǎng)遠(yuǎn),但是最吸引該領(lǐng)域研究者的一個(gè)研究方向則是讓機(jī)器人的智能達(dá)到人類(lèi)水平。

  Leslie Kaelbling:但是現(xiàn)在對(duì)于我來(lái)說(shuō),最有吸引力的研究方向應(yīng)該是研究如何選擇把哪些東西構(gòu)建在系統(tǒng)中、把哪些東西交給系統(tǒng)去學(xué)習(xí)。如果你問(wèn)我多少年后機(jī)器人的智能可以達(dá)到人類(lèi)水平,我甚至都不會(huì)參與這一討論,因?yàn)槲艺J(rèn)為我們錯(cuò)過(guò)了很多想法,也不知道到底需要多少年去實(shí)現(xiàn)這一目標(biāo)。

  Lex Fridman:我不問(wèn)您多少年后可以實(shí)現(xiàn),但是我可能需要問(wèn),對(duì)于我們目前已實(shí)現(xiàn)的成就,您印象比較深刻的是哪個(gè)?您認(rèn)為什么才是不錯(cuò)的智能測(cè)試?您認(rèn)為面向機(jī)器人自然語(yǔ)言的圖靈測(cè)試等測(cè)試基準(zhǔn)怎么樣?是否思考過(guò)這些問(wèn)題?

  Leslie Kaelbling:我比較反對(duì)這些測(cè)試基準(zhǔn)。我認(rèn)為我們花了太多的時(shí)間在爭(zhēng)論哪些事情對(duì)于提高機(jī)器人的性能更好上。

  Lex Fridman:測(cè)試基準(zhǔn)、數(shù)據(jù)集或者圖靈測(cè)試挑戰(zhàn)其實(shí)可以將研究者們匯聚起來(lái),激勵(lì)他們創(chuàng)建出表現(xiàn)更好的機(jī)器人,因?yàn)樗麄兌枷M诒荣愔蝎@勝,例如自動(dòng)駕駛領(lǐng)域的 DARPA 挑戰(zhàn)賽。您怎樣看待它們的價(jià)值呢?

  Leslie Kaelbling:許多人都認(rèn)為這些比賽是具有激勵(lì)性的,是很好的,但是我個(gè)人認(rèn)為它們是反激勵(lì)性的。不過(guò)你們或許能夠獲得一段有趣的時(shí)期——一群聰明的人在比賽中獲得了超大的動(dòng)力,并最大限度地發(fā)揮出腦力,有時(shí)候可能也會(huì)產(chǎn)生很酷的想法,可供我們事后咀嚼。這對(duì)我來(lái)說(shuō)并不是一件好事,不過(guò)我也并不反對(duì)大家這么做。

  Lex Fridman:這就跟您之前所說(shuō)的,某件事以外的所有其他事情都會(huì)讓它變得更好。下面我們跳過(guò)一些問(wèn)題。您創(chuàng)立了《機(jī)器學(xué)習(xí)研究雜志》(Journal of Machine Learning Research,JMLR)并擔(dān)任其主編,那出版這一期刊是基于怎樣的契機(jī)?您如何看待當(dāng)前機(jī)器學(xué)習(xí)和人工智能領(lǐng)域的出版模式?

  Leslie Kaelbling:好的。我之所以會(huì)創(chuàng)立《機(jī)器學(xué)習(xí)研究雜志》,故事源自于當(dāng)時(shí)由 Kluwer 創(chuàng)立的叫做《機(jī)器學(xué)習(xí)》的期刊。當(dāng)時(shí)我也是編輯委員會(huì)中的一員,我們常常會(huì)召開(kāi)一些會(huì)議,向 Kluwer 抱怨,對(duì)于圖書(shū)館來(lái)說(shuō)雜志太過(guò)昂貴并且人們難以在上面發(fā)表文章。當(dāng)時(shí),我們真的希望為這部分人解決這些問(wèn)題,不過(guò)其他人永遠(yuǎn)只會(huì)表示自己的同情而會(huì)采取任何行動(dòng),所以我們就決定創(chuàng)立一份新雜志。當(dāng)時(shí)也有一份雜志叫做《人工智能研究雜志》,這份雜志也采取同樣的出版模型,并且以這一模型存在了 5 年左右的時(shí)間,也發(fā)展得非常好。

  我猜想我們當(dāng)時(shí)都并不知道怎么創(chuàng)立一份雜志,好在這件事情本身并不難。于是,《機(jī)器學(xué)習(xí)》期刊編輯委員會(huì)中 75% 的成員都從那里辭職,來(lái)共同創(chuàng)立了這份新雜志。

  Lex Fridman:所以新創(chuàng)立的這份雜志更加開(kāi)放?

  Leslie Kaelbling:是的,《機(jī)器學(xué)習(xí)研究雜志》是完全開(kāi)放的。當(dāng)時(shí)我有一個(gè)博士后學(xué)生 George Kennedy 就想要呼吁這些雜志免費(fèi)向所有人開(kāi)放。

  由于《機(jī)器學(xué)習(xí)研究雜志》既沒(méi)有版面費(fèi)用,也沒(méi)有訪問(wèn)限制,當(dāng)時(shí)很多人都對(duì)這本雜志心存懷疑,認(rèn)為這是一場(chǎng)欺詐,覺(jué)得這是不可能發(fā)生的事情。運(yùn)行這份雜志期間,我在很長(zhǎng)一段時(shí)間都沒(méi)有存款,因?yàn)樾枰Ц逗献髀蓭熀?IP 地址的費(fèi)用,當(dāng)時(shí)雜志一年的運(yùn)營(yíng)費(fèi)用大概為幾百美元,現(xiàn)在的花費(fèi)可能更高些但是也沒(méi)有高很多。

  之所以一切免費(fèi),是因?yàn)槲矣X(jué)得計(jì)算機(jī)科學(xué)家所具有的能力和自主性,是其他領(lǐng)域的科學(xué)家們所不具備的。我們教授們自己很熟悉這些技術(shù),學(xué)生也熟悉,我們也認(rèn)識(shí)那些有能力制作和破解網(wǎng)站的人,大家一起動(dòng)手,一下午時(shí)間就能做一個(gè)免費(fèi)開(kāi)放的學(xué)術(shù)網(wǎng)站出來(lái)。所以基礎(chǔ)設(shè)施對(duì)我們來(lái)說(shuō)不是問(wèn)題,但對(duì)于其他領(lǐng)域的人來(lái)說(shuō)就是比較難實(shí)現(xiàn)的事情。

  Lex Fridman:所以這一訪問(wèn)開(kāi)放的期刊不需要聲望、也不需要任何其他論文也可以得以出版?

  Leslie Kaelbling:事實(shí)證明,確實(shí)不需要聲望。

  Lex Fridman:在很早之前,我不記得具體的時(shí)間了,當(dāng)時(shí)我評(píng)論了一篇您也評(píng)論過(guò)的論文,記得當(dāng)時(shí)讀到您評(píng)論說(shuō):這篇論文寫(xiě)得非常出色,對(duì)您產(chǎn)生了較大的影響,并影響了您未來(lái)的評(píng)論方式。當(dāng)時(shí)您并不贊成我的觀點(diǎn),但是您將我的評(píng)論修改得更好了。這其實(shí)可以看出,當(dāng)時(shí)雜志的整個(gè)評(píng)論過(guò)程是存在缺陷的,您認(rèn)為該怎樣才能改進(jìn)這一過(guò)程呢?

  Leslie Kaelbling:實(shí)際上,這份雜志創(chuàng)立之初,我想要做一些完全不同的事情,但是最終沒(méi)有實(shí)現(xiàn),這是因?yàn)樗坪跷覀兏枰氖且环輦鹘y(tǒng)的記錄雜志,所以基本上,我們把這份雜志打造得跟一般的雜志一樣,只不過(guò)對(duì)外開(kāi)放訪問(wèn)了。當(dāng)然了,「出版」什么東西現(xiàn)在越來(lái)越變得稀松平常,你隨便在哪個(gè)學(xué)術(shù)文本存儲(chǔ)網(wǎng)站傳一篇文章就算是發(fā)表了,并且對(duì)于所有的這些內(nèi)容,我隔天就可以將它們進(jìn)行出版。因此,將這些內(nèi)容對(duì)外開(kāi)放是沒(méi)有任何障礙的,不過(guò)我們依舊需要進(jìn)行策劃以及評(píng)估,而我沒(méi)有時(shí)間去閱讀所有的檔案,一般認(rèn)為出版社會(huì)公眾所稱(chēng)贊的文章就足夠了。

  這樣的話,你可以說(shuō)我們不再需要任何期刊了,大家只需要把論文傳到學(xué)術(shù)網(wǎng)站上去,然后人們就可以上傳或下載論文,你的簡(jiǎn)歷也就會(huì)顯示文章獲得了多少個(gè)稱(chēng)贊。同時(shí)我認(rèn)為期刊在仔細(xì)閱讀和評(píng)注方面也存在其價(jià)值。在 Twitter 或者 Reddit 上很難辨別讀者對(duì)論文是支持、否定還是爭(zhēng)議的態(tài)度,以及他們是否知道他們?cè)谡務(wù)摰氖鞘裁?。所以我認(rèn)為期刊的第二個(gè)目的是,判斷我應(yīng)該重視那些觀點(diǎn)。

  我不知道如果我有無(wú)限的時(shí)間,我是否也不會(huì)去做這些,因?yàn)槲蚁M寵C(jī)器人來(lái)做這部分工作。但如果我覺(jué)得我傾向于在出版方向上做更多的事情,我會(huì)去實(shí)現(xiàn)我最開(kāi)始想做的另外一件事情,那就是將我重視并且非常清晰的一些人的觀點(diǎn)匯聚起來(lái),至于是對(duì)外公開(kāi)還是私人保留,這個(gè)我不確定。我們可能不會(huì)出版所有的評(píng)論,僅僅將為非常出色的論文所寫(xiě)的評(píng)論對(duì)外開(kāi)放。

  如果一些論文得到 Leslie 的朋友們的評(píng)論,并且論文觀點(diǎn)得到夸獎(jiǎng),論文作者也可以將其寫(xiě)入簡(jiǎn)歷中:Leslie 的朋友們給了我的論文打了五星好評(píng)。這就可以說(shuō)明論文就跟雜志所收錄的論文一樣出色。我認(rèn)為我們應(yīng)該將很好的評(píng)論對(duì)外開(kāi)放,并以某種方式對(duì)這些評(píng)論進(jìn)行組織,但當(dāng)時(shí)我真的不知道該怎么做。

  Lex Fridman:其實(shí)您可以借鑒電影領(lǐng)域的互聯(lián)網(wǎng)電影資料庫(kù)(IMDb),那里匯聚了電影評(píng)論員,他們會(huì)寫(xiě)影評(píng),不過(guò)資料庫(kù)匯中會(huì)定期更新非評(píng)論員寫(xiě)的影評(píng),這兩個(gè)部分是分開(kāi)的。

  Leslie Kaelbling:我喜歡公開(kāi)評(píng)論,我認(rèn)為了解這個(gè)過(guò)程很有趣。

  Lex Fridman:這也許是推進(jìn)論文評(píng)論的一個(gè)正確方向,但是可能仍然無(wú)法像評(píng)論電影或視頻游戲那樣吸引人。這是我的個(gè)人觀點(diǎn),可能聽(tīng)起來(lái)有些愚蠢,但是執(zhí)行評(píng)審的趣味和輕松程度取決于用戶界面,而作為一位評(píng)論家的效率,則意味著向一位優(yōu)秀的評(píng)論家邁進(jìn)了多遠(yuǎn),這些人為因素會(huì)起到作用。

  Leslie Kaelbling:現(xiàn)在給論文寫(xiě)優(yōu)秀的評(píng)論是一項(xiàng)大投資,現(xiàn)在可以看到的論文數(shù)量非常多。每年有 3000 多篇新論文,雖然我不知道每年會(huì)新出多少電影,但是現(xiàn)在我認(rèn)為數(shù)量要比每年新出的機(jī)器學(xué)習(xí)論文要少。

  我是一個(gè)老年人,所以不可避免地會(huì)說(shuō)現(xiàn)在的事情都變化得太快了,像陷在泥巴中一樣執(zhí)著。我認(rèn)為現(xiàn)在研究者們的眼光變得越來(lái)越短視,比如學(xué)生們想要發(fā)表大量論文,他們認(rèn)為這樣才是令人興奮、有價(jià)值的事情,然后拍拍腦袋寫(xiě)論文,諸如此類(lèi)。雖然其中的一些工作成果是不錯(cuò)的,但是我擔(dān)憂的是,這種做法會(huì)把那些花兩年的時(shí)間來(lái)思考某個(gè)問(wèn)題的研究者逼走。

  在我們那個(gè)年代,我們做研究并不發(fā)表論文,你可以花數(shù)年時(shí)間來(lái)研究論文,你可以選擇研究一個(gè)非常難的問(wèn)題,然后花費(fèi)大量時(shí)間來(lái)不斷研究、咀嚼這個(gè)問(wèn)題,當(dāng)你去寫(xiě)作完成論文時(shí),也會(huì)經(jīng)歷一段艱巨的時(shí)期。我不認(rèn)為每個(gè)人都需要按照這種模式進(jìn)行研究,但是我認(rèn)為現(xiàn)在也有一些難度非常高的問(wèn)題需要研究者以更加長(zhǎng)遠(yuǎn)的眼光來(lái)從事這些問(wèn)題的研究。然而我們現(xiàn)在完全沒(méi)有激勵(lì)研究者們采用這種研究方式,這是我所擔(dān)心的地方。

  Lex Fridman:在目前的情況下,對(duì)于 AI 未來(lái)的發(fā)展您有什么期望和擔(dān)憂?AI 已經(jīng)經(jīng)歷了多次寒冬、起起伏伏,您認(rèn)為還會(huì)有下一次寒冬到來(lái)嗎?您是否對(duì)于創(chuàng)造出如您所說(shuō)的機(jī)器人更抱有期待?

  Leslie Kaelbling:我認(rèn)為經(jīng)歷這個(gè)周期是無(wú)法避免的,但是這個(gè)起伏的周期曲線實(shí)際上是一次比一次高的,就像你用一個(gè)有噪聲的優(yōu)化器優(yōu)化某個(gè)函數(shù)曲線一樣。顯而易見(jiàn),機(jī)器學(xué)習(xí)的出現(xiàn)對(duì)于人工智能領(lǐng)域的發(fā)展,意義深遠(yuǎn)且重大,毫無(wú)疑問(wèn),目前人工智能的發(fā)展是比之前更高的。當(dāng)然,我也認(rèn)為人們高估了人工智能,吹的牛皮太大,投資者們最終會(huì)說(shuō),「當(dāng)初說(shuō)得那么好聽(tīng),怎么最后什么都沒(méi)做到」。這些泡沫未來(lái)可能會(huì)破滅。但我覺(jué)得在實(shí)現(xiàn)達(dá)到人類(lèi)水平的人工智能的過(guò)程中是不可能一帆風(fēng)順地一直向上的。

  Lex Fridman:您對(duì)于 AI 所存在的威脅是否有短期或者長(zhǎng)期的擔(dān)憂呢?或許短期的擔(dān)憂會(huì)比較少,但是關(guān)于將會(huì)有更多機(jī)器人替代人類(lèi)工作的擔(dān)憂呢?

  Leslie Kaelbling:我們可以探討一下效用問(wèn)題。實(shí)際上我之前與一些軍事倫理學(xué)家有過(guò)一次有趣的交流,他們希望跟我探討自動(dòng)核武器的問(wèn)題。他們是非常有趣、聰明并且接受過(guò)良好教育的一群人,但是他們對(duì)于人工智能和機(jī)器學(xué)習(xí)知之甚少。他們問(wèn)我的第一個(gè)問(wèn)題就是,你研發(fā)的機(jī)器人有做過(guò)什么你沒(méi)有預(yù)料到的事情嗎?我情不自禁地笑出聲,因?yàn)樯晕⒘私膺^(guò)機(jī)器人的人都知道,它們做不出來(lái)。而我意識(shí)到,他們對(duì)于我們?cè)鯓訉?duì)機(jī)器人編程的理解是錯(cuò)誤的,他們認(rèn)為我們對(duì)機(jī)器人編程就像給樂(lè)高的 Mindstorm 機(jī)器人編程一樣,執(zhí)行前進(jìn)一米、左轉(zhuǎn)、拍照這些動(dòng)作。這樣的編程方式固然也是對(duì)的,但這種機(jī)器人如果做一些預(yù)料之外的事情,就有點(diǎn)奇怪了。

  事實(shí)上,我認(rèn)為這應(yīng)該成為我一項(xiàng)新的教育任務(wù),如果我需要跟非專(zhuān)業(yè)人員交流,我要試圖去教給讓他們理解:我們控制的其實(shí)是機(jī)器人中至少一個(gè)或多個(gè)層次的抽象,同時(shí)機(jī)器人還存在假設(shè)層,可以是規(guī)劃空間或者分類(lèi)器空間,此外還有一系列答案和目標(biāo)函數(shù),然后我們使用一些優(yōu)化方法,在各個(gè)層級(jí)優(yōu)化解決方案,并且我們不知道最終產(chǎn)生的解決方案是什么。我認(rèn)為溝通這些非常重要,或許其中有一些人了解相關(guān)知識(shí),但我還是認(rèn)為這種溝通這門(mén)學(xué)科是必不可少的。

  現(xiàn)在有很多人在探討價(jià)值對(duì)齊的問(wèn)題,我們可以確定的是,當(dāng)機(jī)器人或者軟件系統(tǒng)的能力越來(lái)越強(qiáng)時(shí),它們的目標(biāo)會(huì)與人類(lèi)的目標(biāo)更加一致,或者說(shuō)二者間的目標(biāo)會(huì)以某種方式互相兼任,也可以說(shuō)當(dāng)它們與我們有不同的目標(biāo)時(shí),我們也可以用一種很好的方式去進(jìn)行調(diào)和。

  因此我認(rèn)為思考這些術(shù)語(yǔ)非常重要,比如說(shuō),你無(wú)需被機(jī)器人世界末日論所嚇倒,而是思考價(jià)值對(duì)齊的目標(biāo)函數(shù)的重要性。每一位從事優(yōu)化工作的研究者都知道,必須要謹(jǐn)慎考量最終期望得到的東西,比如說(shuō)研究者們有時(shí)候可能獲得了最佳的解決方案,然而最終發(fā)現(xiàn)目標(biāo)方向是錯(cuò)誤的。

  對(duì)于我來(lái)說(shuō),即便在最短時(shí)期內(nèi),務(wù)實(shí)也是至關(guān)重要的問(wèn)題,任何一位從算法工程師到目標(biāo)函數(shù)工程師的研究者,這一問(wèn)題都完全有可能發(fā)生,并且會(huì)改變我們的思維和方法論。

  Lex Fridman:所以可以說(shuō),您的研究生涯始于斯坦福的哲學(xué)專(zhuān)業(yè),現(xiàn)在又回歸到哲學(xué)中來(lái)。

  Leslie Kaelbling:我在上課時(shí)也提到過(guò),當(dāng)機(jī)器學(xué)習(xí)研究者在設(shè)計(jì)目標(biāo)函數(shù)時(shí),需要「戴上兩個(gè)帽子」,一個(gè)「帽子」是他需要實(shí)現(xiàn)的目標(biāo)是什么;另一個(gè)「帽子」則是他的優(yōu)化器能夠?qū)?yōu)化實(shí)現(xiàn)到什么程度,這都是需要考慮和衡量的要點(diǎn)。

  關(guān)于機(jī)器人會(huì)取代人類(lèi)工作這一擔(dān)憂,我能理解這件事情非常重要,但我不太了解社會(huì)學(xué)、經(jīng)濟(jì)學(xué),也不是很了解人類(lèi),所以我不知道該怎么看待這個(gè)問(wèn)題。

  Lex Fridman:確實(shí),這個(gè)問(wèn)題涉及到社會(huì)學(xué)和經(jīng)濟(jì)學(xué)的方面,很難去講清楚。

  Leslie Kaelbling:雖然這個(gè)問(wèn)題并不是我的專(zhuān)長(zhǎng),但我還是認(rèn)為人類(lèi)思考這個(gè)問(wèn)題很有必要。

  Lex Fridman:您認(rèn)為對(duì)于人工智能領(lǐng)域以及您自己而言,短期內(nèi)哪個(gè)領(lǐng)域的研究會(huì)是最令人興奮的?

  Leslie Kaelbling:我之前講述過(guò)如何設(shè)計(jì)智能機(jī)器人的事情,智能機(jī)器人是我們這個(gè)領(lǐng)域中大部分人都想要實(shí)現(xiàn)的目標(biāo),而大家面臨的問(wèn)題則是,機(jī)器人怎樣實(shí)現(xiàn)最高效的策略?我們可以嘗試很多不同的極端方案,其中一個(gè)非常極端的方案就是做內(nèi)?。↖ntrospection),然后編程,這種方法現(xiàn)在的表現(xiàn)還不是很好;另一個(gè)極端的方案是我們采用了一大堆神經(jīng)網(wǎng)絡(luò),然后訓(xùn)練它們?nèi)ネ瓿扇蝿?wù),我同樣也認(rèn)為這個(gè)方案無(wú)法奏效。

  在這個(gè)過(guò)程中面臨的一個(gè)問(wèn)題就是找到中間立場(chǎng),這個(gè)問(wèn)題同樣也不是技術(shù)上的問(wèn)題,僅僅是關(guān)于怎樣找到最佳實(shí)現(xiàn)方法的問(wèn)題。對(duì)于我來(lái)說(shuō),它很明顯是學(xué)習(xí)和非學(xué)習(xí)的一種組合,需要考慮的怎樣構(gòu)建這個(gè)組合的內(nèi)容。這也是對(duì)我最具有吸引力的一個(gè)問(wèn)題。

  Lex Fridman:最后一個(gè)問(wèn)題是,在科幻小說(shuō)中,您最喜歡的機(jī)器人是哪個(gè)?比如說(shuō)《星球大戰(zhàn)》中的 R2D2 機(jī)器人或是更加現(xiàn)代化的 HAL 機(jī)器人。

  Leslie Kaelbling:我個(gè)人更加關(guān)注的是研究機(jī)器人的過(guò)程。實(shí)際上我研究機(jī)器人是因?yàn)檫@個(gè)研究方向很有趣,而并不在乎我能夠研發(fā)出怎樣的機(jī)器人。

  Lex Fridman:今天這場(chǎng)美麗的對(duì)話就到此結(jié)束了,非常感謝您今天的發(fā)言。

  Leslie Kaelbling:當(dāng)然,今天的對(duì)話很有趣。

  (完)

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多