|
昨天,ACM把2018年圖靈獎頒給了深度學習領(lǐng)域的三位學者。他們是:Geoffrey Hinton、Yann LeCun、Yoshua Bengio。 Yann LeCun、Geoffrey Hinton、Yoshua Bengio 今天我們就來聊一聊這位72歲獲圖靈獎的Geoffrey Hinton。 "教育上的多動癥" Hinton教授是機器學習的開創(chuàng)者,使得計算機可以獨立模擬程序、自己解決問題。特別重要的是,他開辟了機器學習子領(lǐng)域--深度學習:讓那些機器像一個蹣跚學步的孩子一樣,模仿大腦的神經(jīng)網(wǎng)絡(luò)形式。 Hinton出生在英國一個學術(shù)背景顯赫的世家。在他小時候,他媽就給了他一個人生選擇題:"做學者,或是做失敗者。"當Hinton還是一個7歲的孩子時,他就知道自己日后肯定要讀博。 后來,當被問起對于生長在一個顯赫之家中作何感想時,Hinton說:"壓力。"Hinton說,自己一輩子都在壓抑、沮喪中掙扎,而工作就是他釋放壓力的方式。 1960年,Hinton還是高中生,有一天,一個朋友告訴他,人腦的工作原理就像全息圖一樣。大腦并非將記憶儲存在一個特定的地方,而是在整個神經(jīng)網(wǎng)絡(luò)里傳播。 這句話對Hinton的人生有著不一般的意義,成為他之后人生的起點。 Hinton是個很愛折騰的人,回頭思考他這種愛折騰,就像是一個人在睡眠中不停地變換姿勢,以便尋找覺得最舒服的那個。他不停的折騰,最終的方向似乎是最大程度地點燃他頭腦最深處的那團火花。 他說,"我有一種教育上的多動癥。"最開始,他去克利夫頓大學,畢業(yè)后進入劍橋的國王學院攻讀物理和化學,一個月后就退學了。一年后,他再次申請攻讀建筑學,上了一天課后,又轉(zhuǎn)而攻讀物理學和生理學,然后又是退學。最后,他改讀哲學,這回他呆夠了一年。"我對哲學仿佛產(chǎn)生抗體,因為我想了解大腦是如何運轉(zhuǎn)的。" 從哲學系出來,他開始研究心理學,不久之后也退了學。退學后,他在鄉(xiāng)下當過一段木匠。不過也沒閑著,每個星期六早上,他都會去附近的圖書館,在筆記本里匆匆記下關(guān)于大腦工作原理的理論。 從1972年開始,他又開始了學習生涯,在愛丁堡大學開始神經(jīng)網(wǎng)絡(luò)研究探索,攻讀愛丁堡大學Christopher Longuet-Higgins麾下的人工智能博士學位。Christopher Longuet-Higgins是位桃李滿天下的教授,他的學生包括諾貝爾獎獲得者John Polanyi,多倫多大學化學家和理論物理學家Peter Higgs等。 2 "大腦以某種形式學習,但并非編程" Hinton認為,神經(jīng)網(wǎng)絡(luò)一定是未來趨勢,但導師堅持傳統(tǒng)AI取勝。導師的觀念代表當時學術(shù)界的主流觀點,那就是——計算機最佳的學習方式,就是規(guī)則和邏輯。而Hinton認為,計算機將像人腦一樣學習。"就像小孩一樣,你不會告訴他們‘這個是主動,這個是被動?!^段時間,他們自然就明白了。神經(jīng)網(wǎng)絡(luò)也是如此。" 博士畢業(yè),他輾轉(zhuǎn)在美國的幾所大學繼續(xù)他的研究,由于不滿于大部分AI研究工作是由美國國防部資助。于是他辭職,并搬到基本無軍事資助的加拿大。加拿大給了他一份不錯的工資和自由的研究空間。 神經(jīng)網(wǎng)絡(luò)被束之高閣也是有歷史原因的。1957年,康奈爾大學的科學家Frank Rosenblatt發(fā)布了世界上第一臺神經(jīng)網(wǎng)絡(luò)機器。這個機器被稱為感知器(Perceptron),它的任務(wù)是圖像識別。理論上,如果你給感知器看一張?zhí)O果的照片,它就能告訴你這是"蘋果"。這個感知器運行在IBM的機器上。1958年,紐約時報預測這將是第一個能像人腦一樣思考的設(shè)備,"(感知器)將能走路、說話、觀察、書寫、自我復制,意識到它自己的存在"。 然而并沒有。這個機器左右不分,更何談與人腦媲美。彼時神經(jīng)網(wǎng)絡(luò)基本在學術(shù)圈被除名了,然而這并沒有阻擋Hinton。 1980年代,Hinton參與使用計算機模擬大腦的研究,這也便是如今所說"深度學習"概念,然而學術(shù)期刊因為不認可神經(jīng)網(wǎng)絡(luò)這一理念而頻頻拒收論文。 "大腦必然以某種方式運作,但肯定不是編好的程序,"Hinton說,他相信神經(jīng)網(wǎng)絡(luò)并沒有錯,問題在于計算力。要讓計算機發(fā)現(xiàn)圖片的意義,需要先給它數(shù)百萬張圖片,但當時的設(shè)備還做不到。樣本量太小了。 后來人們用"寒冬"形容當時神經(jīng)網(wǎng)絡(luò)在學術(shù)界的境況。 1986年,Hinton和小伙伴完成著名的論文Experiments on Learning by Back Propagation,證明在神經(jīng)網(wǎng)絡(luò)中的反向傳播可以提供"有趣的"分布表示,提出了影響后世人工智能的新方法。 可惜鑒于當時數(shù)據(jù)與計算的影響,神經(jīng)網(wǎng)絡(luò)無法進行大規(guī)模訓練。 到90年代末,神經(jīng)網(wǎng)絡(luò)和反向傳播被機器學習社區(qū)大量遺棄,同時也被計算機視覺和語音識別領(lǐng)域忽略。人們普遍認為,學習有用的、多層級的、幾乎不靠先驗知識的特征提取器并不現(xiàn)實可行。 Hinton和他的神經(jīng)網(wǎng)絡(luò)只能坐在學術(shù)界的外圍。 但也不完全是寒冷。這個期間,發(fā)生了一些很重要的事。他有了非常重要的小伙伴。其中就包括Yann LeCun,也就是這次獲獎?wù)咧弧K荋inton的博士后學生,也是神經(jīng)網(wǎng)絡(luò)的堅定信仰者。 3 "我必須選出那些擁有最佳判斷力的人" 2009年,Hinton以及他兩個研究生D.Mohamed等,用神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音的聲學建模,在小詞匯量連續(xù)語音識別數(shù)據(jù)庫TIMIT上,獲得了語音識別競賽勝利,隨后,這項基于神經(jīng)網(wǎng)絡(luò)的方法被應(yīng)用于谷歌安卓手機上。 工業(yè)界很快注意到變化的發(fā)生,微軟、Facebook、谷歌等科技巨頭開始在這個領(lǐng)域投資。 坐了30多年冷板凳的神經(jīng)網(wǎng)絡(luò)終于迎來它的時代。 神經(jīng)網(wǎng)絡(luò)的翻身,一方面仰仗計算力的發(fā)展,使復雜神經(jīng)網(wǎng)絡(luò)的實現(xiàn)成為可能。30年前,并非沒人知道神經(jīng)網(wǎng)絡(luò)多一些隱藏層效果會更好,只是還沒有足夠的環(huán)境去做到。其次,是算法的進步,尤其是一系列深度學習的算法的提出。 從2009年開始,隨著他學生還有無數(shù)研究者所做出的一系列貢獻,Hinton在深度學習所做的研究開始為人所知并接受,也被人們推舉為計算新時代領(lǐng)頭人。現(xiàn)在,神經(jīng)網(wǎng)絡(luò)涵蓋了所有的人工智能算法,并借助科技企業(yè)的各類應(yīng)用傳播開來。 2015年,Geoffrey Hinton、Yann LeCun、Yoshua Bengio這三位深度學習巨頭曾在Nature上共同發(fā)表一篇名為《深度學習》的綜述文章,講述了深度學習為傳統(tǒng)機器學習帶來的變革。 當然,后來的故事大家都知道了。 Hinton在學術(shù)界,突然從默默無聞變成明星。 "我之所以有很大的影響力,是因為我是少數(shù)相信這個道路的人之一,所有相信這個方向的學生跟隨著我一起工作,我必須選出那些擁有最佳判斷力的人。"Hinton說。 現(xiàn)在,Hinton一半時間在多倫多大學教書,一半時間在Google建設(shè)神秘的Google大腦。 最后,總結(jié)中心思想的時候到了。今天這個故事我覺得講了兩件事:認清自己與堅持下去。這兩件事都不容易,無論是科學家還是常人。 以上文章整合自公開報道,整理:《中國教育網(wǎng)絡(luò)》編輯部,南京大學周會群教授對本文亦有貢獻。 |
|
|