小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

人工智能未來(lái) | 漫談小樣本的類(lèi)人概念學(xué)習(xí)與大數(shù)據(jù)的深度強(qiáng)化學(xué)習(xí)

 LZS2851 2016-03-20

人工智能未來(lái) | 漫談小樣本的類(lèi)人概念學(xué)習(xí)與大數(shù)據(jù)的深度強(qiáng)化學(xué)習(xí)

Artificial Intelligence,人工智能,最近非?;馃岬脑?huà)題,也算是人類(lèi)最美好的夢(mèng)想之一。但是非??上В幢鉇lphaGO已經(jīng)成功挑戰(zhàn)了人類(lèi)智力游戲的最后的一塊高地——圍棋,到目前為止仍然還沒(méi)有看到人工智能產(chǎn)生“自我”意識(shí)的希望,也就說(shuō),人工智能至少現(xiàn)在階段還無(wú)法超越人類(lèi)智慧,即便在學(xué)習(xí)和識(shí)別方面,人工智能和人類(lèi)相比還是存在較大差距。

人工智能,與計(jì)算機(jī)之父圖靈的名字緊緊聯(lián)系在一起,但是這位大師被當(dāng)時(shí)英國(guó)當(dāng)局迫害英年早逝,除了留給人類(lèi)無(wú)可估量的思想財(cái)富,也激發(fā)了喬布斯的靈感,設(shè)計(jì)出了咬掉一口的蘋(píng)果公司標(biāo)志。圖靈在 1950 年的論文里,提出了圖靈試驗(yàn)的設(shè)想,即通過(guò)隔墻對(duì)話(huà),你將不知道與你談話(huà)的是人還是計(jì)算機(jī)。這無(wú)疑給人工智能預(yù)設(shè)了一個(gè)很高的期望值,半個(gè)多世紀(jì)以來(lái)人類(lèi)在這方面的進(jìn)展卻十分緩慢。

但是自 2006 年以來(lái),深度學(xué)習(xí)的出現(xiàn)似乎讓人類(lèi)重新看到了希望,至少通過(guò)圖靈測(cè)試不是那么可望而不可及了。人類(lèi)似乎找到了解決“抽象概念”的關(guān)鍵,在這十多年時(shí)間,隨著Google、Facebook、Amazon的加入更是加速了深度學(xué)習(xí)的發(fā)展,目前深度學(xué)習(xí)已經(jīng)廣泛應(yīng)用到數(shù)據(jù)搜索、圖像識(shí)別、語(yǔ)音識(shí)別、氣候預(yù)測(cè)、地理數(shù)據(jù)等等各個(gè)領(lǐng)域并且?guī)Ыo了我們前所未有的體驗(yàn)。

人工智能未來(lái) | 漫談小樣本的類(lèi)人概念學(xué)習(xí)與大數(shù)據(jù)的深度強(qiáng)化學(xué)習(xí)

但是,深度學(xué)習(xí)真的就是這么神奇?深度學(xué)習(xí)真能解決人工智能當(dāng)前面臨的諸多問(wèn)題嗎?正是因?yàn)樯疃葘W(xué)習(xí)過(guò)于火熱了,筆者才必須要寫(xiě)這篇文章,因?yàn)槲覀冞€忽視了一個(gè)同樣關(guān)鍵的技術(shù)——貝葉斯學(xué)習(xí),這里借鑒《Science》一篇著名的論文中的概念,我們姑且稱(chēng)之為類(lèi)人概念學(xué)習(xí),那么就讓我們來(lái)漫談一下這兩個(gè)技術(shù),到底如何才能形成我們真正需要的人工智能呢?

什么是深度強(qiáng)化學(xué)習(xí)?

現(xiàn)在街頭巷尾都在談?wù)摰臋C(jī)器學(xué)習(xí),其實(shí)是一個(gè)非常寬泛的概念,而其中最酷的分支要算是深度學(xué)習(xí)(Deeplearning)和強(qiáng)化學(xué)習(xí)(Reinforcement learning)了。谷歌的DeepMind就是將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)這兩者的精髓合二為一,提出了深度強(qiáng)化學(xué)習(xí)。在2014年的時(shí)候,這個(gè)團(tuán)隊(duì)就在《Nature》雜志上發(fā)表了題為《Human-level control through deep reinforcement learning》的論文,讓業(yè)界對(duì)此充滿(mǎn)了期待。

深度學(xué)習(xí)起源于2006年,這要感謝機(jī)器學(xué)習(xí)領(lǐng)域的泰斗Geoffrey Hinton先生,是他在《Science》上的一篇著名論文開(kāi)啟了深度學(xué)習(xí)的浪潮。Geoffrey Hinton先生是個(gè)非常勤奮的學(xué)者,老人家腰椎不是太好,寫(xiě)個(gè)代碼都得站著,而且還無(wú)法坐飛機(jī),正所謂,偉大的人總要有偉大的付出,在此,向他致敬!

深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí)中建模數(shù)據(jù)的隱含分布的多層表達(dá)的算法。換句話(huà)來(lái)說(shuō),深度學(xué)習(xí)算法自動(dòng)提取分類(lèi)中所需要的低層次或者高層次特征。因此深度學(xué)習(xí)能夠更好的表示數(shù)據(jù)的特征,同時(shí)由于模型的層次、參數(shù)很多,容量也足夠,因此,深度學(xué)習(xí)模型有能力表示大規(guī)模數(shù)據(jù),所以對(duì)于圖像、語(yǔ)音這種特征不明顯的棘手問(wèn)題,反而能夠借助深度學(xué)習(xí)在大規(guī)模訓(xùn)練數(shù)據(jù)上取得更好的效果。而且由于深度學(xué)習(xí)將特征和分類(lèi)器結(jié)合到一個(gè)框架中,用數(shù)據(jù)去學(xué)習(xí)特征,在使用中減少了手工提取特征的巨大工作量,因此,不僅僅效果可以更好,而且應(yīng)用起來(lái)也非常方便。因此深度學(xué)習(xí)在圖像識(shí)別和語(yǔ)音識(shí)別方面獲得了巨大的進(jìn)步。

強(qiáng)化學(xué)習(xí),其實(shí),就是一個(gè)連續(xù)決策的過(guò)程,其特點(diǎn)是不給任何數(shù)據(jù)做標(biāo)注,僅僅提供一個(gè)回報(bào)函數(shù),這個(gè)回報(bào)函數(shù)決定當(dāng)前狀態(tài)得到什么樣的結(jié)果(比如“好”還是“壞”),從數(shù)學(xué)本質(zhì)上來(lái)看,還是一個(gè)馬爾科夫決策過(guò)程。強(qiáng)化學(xué)習(xí)最終目的是讓決策過(guò)程中整體的回報(bào)函數(shù)期望最優(yōu)。

通過(guò)所謂的類(lèi)似于人腦網(wǎng)狀結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)是可以解決很多很實(shí)際的問(wèn)題。例如谷歌的圖像搜索,F(xiàn)acebook的人臉識(shí)別,Skype的實(shí)時(shí)翻譯以及Twitter的色情語(yǔ)言識(shí)別。強(qiáng)化學(xué)習(xí)則將深度學(xué)習(xí)又往前推進(jìn)了一步,一旦你建立起了一個(gè)玩游戲的深度學(xué)習(xí)網(wǎng)絡(luò),你可以通過(guò)強(qiáng)化學(xué)習(xí),讓它和自己進(jìn)行比賽,自我進(jìn)化。

人工智能未來(lái) | 漫談小樣本的類(lèi)人概念學(xué)習(xí)與大數(shù)據(jù)的深度強(qiáng)化學(xué)習(xí)

什么是類(lèi)人概念學(xué)習(xí)?

事實(shí)上,在深度學(xué)習(xí)火熱之前,人工神經(jīng)網(wǎng)絡(luò)也曾熱鬧了一番。在 20世紀(jì)80年代末期,用于人工神經(jīng)網(wǎng)絡(luò)的反向傳播算法(也稱(chēng)Back Propagation算法或者BP算法)的發(fā)明,也曾掀起了基于統(tǒng)計(jì)模型的機(jī)器學(xué)習(xí)熱潮。當(dāng)初人們希望利用BP算法可以讓一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型從大量訓(xùn)練樣本中學(xué)習(xí)統(tǒng)計(jì)規(guī)律,從而對(duì)未知事件進(jìn)行預(yù)測(cè)。但是實(shí)際上BP算法距離這個(gè)目標(biāo)還非常遙遠(yuǎn),90年代中后期BP熱潮就逐漸褪去。但是不管怎樣,BP帶來(lái)了很多新的思路,并且證明了基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法比基于人工規(guī)則的系統(tǒng),確實(shí)在很多方面都要先進(jìn)。Geoffrey Hinton先生就是在這股冷嘲中繼續(xù)堅(jiān)持,最終打開(kāi)了深度學(xué)習(xí)的大門(mén)。

但是深度學(xué)習(xí)真的就像熱捧的那樣無(wú)所不能嗎?實(shí)際上,并非這樣,每次科學(xué)進(jìn)步都會(huì)帶有兩面性,也同時(shí)存在著天生的缺陷,因此科學(xué)研究總會(huì)有很多思想分支,形成諸多學(xué)派,而每個(gè)學(xué)派都會(huì)針對(duì)某種場(chǎng)景或者問(wèn)題再次深入分析。這就說(shuō)明,機(jī)器學(xué)習(xí)也絕非深度學(xué)習(xí)這個(gè)分支領(lǐng)域能夠達(dá)到人工智能所要求的。特別是在國(guó)內(nèi)一窩蜂熱炒深度學(xué)習(xí)或者AlphaGO的時(shí)候,美國(guó)科學(xué)界仍然相當(dāng)冷靜。其實(shí),其他學(xué)派的進(jìn)展顯然也是非常顯著,12月份《Science》的封面文章就是Brenden M. Lake等人撰寫(xiě)的《Human-level concept learning through probabilistic program induction》。國(guó)內(nèi)通常翻譯稱(chēng)為《通過(guò)概率規(guī)劃歸納的人類(lèi)層次概念學(xué)習(xí)》,而筆者認(rèn)為采用“類(lèi)人概念學(xué)習(xí)”這個(gè)詞語(yǔ)顯得更加貼切。這篇文章與谷歌在《Nature》發(fā)表的封面文章遙相呼應(yīng),共同為人工智能的探索提供了思路,但很可惜的是,國(guó)內(nèi)幾乎把這篇文章忽略了。

那什么是“類(lèi)人概念學(xué)習(xí)”?回答這個(gè)概念之前,我們先回顧一下深度學(xué)習(xí),深度學(xué)習(xí)基于大數(shù)據(jù)通過(guò)多層網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)“抽象概念”的理解,顯然數(shù)據(jù)越多其效果相對(duì)就會(huì)越好,但是若沒(méi)有大數(shù)據(jù)怎么辦?何況人類(lèi)的知識(shí)也是一點(diǎn)點(diǎn)積累的,對(duì)于人類(lèi)來(lái)說(shuō),即便沒(méi)有積累,沒(méi)有相應(yīng)的專(zhuān)業(yè)知識(shí),實(shí)際上我們也能“照貓畫(huà)虎”。從這點(diǎn)上來(lái)看,以深度學(xué)習(xí)為核心的人工智能就遠(yuǎn)遠(yuǎn)不及人類(lèi),因?yàn)槿祟?lèi)面對(duì)陌生環(huán)境依然能夠通過(guò)學(xué)習(xí)做出適應(yīng)變化。因此“類(lèi)人概念學(xué)習(xí)”首先就要解決深度學(xué)習(xí)的這種弊端,即不依賴(lài)大數(shù)據(jù)也能進(jìn)行自我學(xué)習(xí),筆者通常定義為“小樣本學(xué)習(xí)”。

“小樣本學(xué)習(xí)”的概念依然是太廣了,而且也不是什么太新的概念,這個(gè)研究思路比神經(jīng)網(wǎng)絡(luò)的出現(xiàn)還要早很多年。筆者所提到的“小樣本學(xué)習(xí)”,核心就是貝葉斯規(guī)劃學(xué)習(xí)(Bayesian Program Learning,BPL),為了與深度學(xué)習(xí)(DeepLearning, DL)相區(qū)分,一般稱(chēng)為BPL方法。BPL方法是利用參數(shù)的先驗(yàn)分布,由小樣本信息求來(lái)的后驗(yàn)分布,直接求出總體分布。這種方法使用概率去表示所有形式的不確定性,通過(guò)概率規(guī)則來(lái)實(shí)現(xiàn)學(xué)習(xí)和推理過(guò)程。

我們?cè)賮?lái)回顧一下Brenden M. Lake等人的論文,其中一張圖概括了BPL方法的流程:圖中parts部分學(xué)到的是提筆-落筆的這一段筆畫(huà)過(guò)程,sub-parts學(xué)到的是由于暫停分割開(kāi)的更小的筆畫(huà),這兩者結(jié)合就生成字符的模板object template,同時(shí)模板還分為attached along和attached at start兩種。論文中用來(lái)訓(xùn)練的數(shù)據(jù)除了完整的字符以外,只有具體筆畫(huà)的樣本,總體可提供的數(shù)據(jù)樣本非常少。

人工智能未來(lái) | 漫談小樣本的類(lèi)人概念學(xué)習(xí)與大數(shù)據(jù)的深度強(qiáng)化學(xué)習(xí)

BPL方法的目的就是為了解決“看一眼就會(huì)寫(xiě)字”的問(wèn)題,這完完全全只能基于小樣本,只需要一個(gè)陌生文字系統(tǒng)的字符,BPL方法就能很快學(xué)到精髓把這個(gè)文字寫(xiě)出來(lái),甚至還能寫(xiě)出其他類(lèi)似的文字。而且更為重要的是,這篇論文展現(xiàn)的BPL方法還通過(guò)了視覺(jué)圖靈測(cè)試。這也得益于BPL方法觀察到的每個(gè)訓(xùn)練樣例可以增量地降低或升高某假設(shè)的估計(jì)概率,而其他算法會(huì)在某個(gè)假設(shè)與任一樣例不一致時(shí)完全去掉該假設(shè)。但是BPL方法需要概率的初始知識(shí),當(dāng)概率預(yù)先未知時(shí),可以基于背景知識(shí)、預(yù)先準(zhǔn)備好的數(shù)據(jù)以及基準(zhǔn)分布的假定來(lái)估計(jì)這些概率。

兩種學(xué)習(xí)之間有什么區(qū)別?

來(lái)看一下劍橋大學(xué)信息工程教授Zoubin Ghahramani對(duì)貝葉斯規(guī)劃學(xué)習(xí)(BPL)的評(píng)價(jià),他認(rèn)為BPL對(duì)人工智能、認(rèn)知科學(xué)和機(jī)器學(xué)習(xí)是一個(gè)重大的貢獻(xiàn)。深度學(xué)習(xí)目前已取得了重要的成功,但是也必須非常清醒地認(rèn)識(shí)到深度學(xué)習(xí)的局限性,因?yàn)樯疃葘W(xué)習(xí)需要大量的數(shù)據(jù),并且在很多任務(wù)上表現(xiàn)很差。

深度學(xué)習(xí)(DL)主要解決的是計(jì)算機(jī)“運(yùn)籌帷幄”的問(wèn)題,實(shí)現(xiàn)“要從大量數(shù)據(jù)形成抽象”;而貝葉斯規(guī)劃學(xué)習(xí)(BPL)主要解決的是計(jì)算機(jī)“照貓畫(huà)虎”的問(wèn)題,實(shí)現(xiàn)“僅從一個(gè)例子就形成概念”。打個(gè)比方來(lái)說(shuō),深度學(xué)習(xí)更會(huì)分析規(guī)律和預(yù)測(cè)趨勢(shì),而貝葉斯規(guī)劃學(xué)習(xí)更會(huì)舉一反三和當(dāng)機(jī)立斷。深度學(xué)習(xí)模仿人類(lèi)大量閱讀書(shū)籍自我揣摩形成判斷,而貝葉斯規(guī)劃學(xué)習(xí)則是通過(guò)觀察單個(gè)案例進(jìn)行迅速?zèng)Q策。當(dāng)然,貝葉斯規(guī)劃學(xué)習(xí)的決策可能是錯(cuò)誤的,特別是在沒(méi)有形成先驗(yàn)概率的時(shí)候。

類(lèi)人概念學(xué)習(xí)會(huì)是未來(lái)嗎?

那么,以貝葉斯規(guī)劃學(xué)習(xí)為核心的類(lèi)人概念學(xué)習(xí)將會(huì)是未來(lái)的主要方向嗎?回答這個(gè)問(wèn)題之前,我們首先看下深度學(xué)習(xí)的奠基者Geoffrey Hinton先生對(duì)BPL方法的評(píng)價(jià)。Geoffrey Hinton先生首先肯定了BPL模型通過(guò)視覺(jué)圖靈測(cè)試的意義,他認(rèn)為BPL方法最令人興奮的成果或許是能讓那些宣稱(chēng)智能計(jì)算機(jī)系統(tǒng)的學(xué)習(xí)方式與人類(lèi)完全不同的批評(píng)者閉嘴,因?yàn)樗麄兊闹饕摀?jù)正是計(jì)算機(jī)不能從單個(gè)例子中形成概念。

我們知道深度學(xué)習(xí)近年來(lái)取得了舉世矚目的成就,被廣泛應(yīng)用在許多領(lǐng)域,例如內(nèi)容搜索、語(yǔ)音識(shí)別、圖像識(shí)別等。但是現(xiàn)在看來(lái),似乎貝葉斯規(guī)劃學(xué)習(xí)要比深度學(xué)習(xí)的表現(xiàn)更好一點(diǎn),因?yàn)檫@種方法更加適合我們?nèi)祟?lèi)適應(yīng)環(huán)境的方式。當(dāng)然,兩種學(xué)習(xí)方法在不同的任務(wù)上還是獨(dú)具特色,各領(lǐng)風(fēng)騷,假如能彼此借鑒,相互融合,一定能夠大幅提升人工智能的水平。當(dāng)數(shù)據(jù)量巨大但較混亂的情況下,深度學(xué)習(xí)能發(fā)揮優(yōu)勢(shì);而在數(shù)據(jù)量較少而清晰的情況下,貝葉斯規(guī)劃學(xué)習(xí)占領(lǐng)上風(fēng)。

筆者一直認(rèn)為科學(xué)研究中,哲學(xué)上的思路發(fā)展遠(yuǎn)比技術(shù)本身更加重要!類(lèi)人概念學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)的未來(lái)也必然是渾然融合成一體,只有這樣才符合人類(lèi)學(xué)習(xí)和決策的過(guò)程,才真正能提升人工智能的水平。筆者也曾借助聲音和圖像融合研究的基礎(chǔ),花費(fèi)大量時(shí)間研究這兩種方法的融合,并致力于設(shè)計(jì)出一個(gè)異構(gòu)學(xué)習(xí)方法融合的混血系統(tǒng),來(lái)解決大數(shù)據(jù)中的降維、異構(gòu)問(wèn)題,并發(fā)揮小樣本學(xué)習(xí)的優(yōu)勢(shì),利用人工智能滿(mǎn)足我們實(shí)際生活中的事務(wù)性需求。當(dāng)然,這急需相關(guān)人才的加入,如您有興趣參加到這項(xiàng)偉大的事業(yè)中來(lái),您可以通過(guò)聲學(xué)在線(xiàn)直接與我們聯(lián)系,或者直接郵件聯(lián)系我們hr@soundai.com。

相關(guān)文章推薦

聲學(xué)在線(xiàn):知識(shí),趣味,圈子

微信平臺(tái):公眾號(hào)搜索“聲學(xué)在線(xiàn)”

網(wǎng)站平臺(tái):soundonline.org

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多