前段時間,「AI 破解三體問題」、「AI 哥白尼重新發(fā)現(xiàn)物理規(guī)律」的新聞充斥各大媒體的頭條,感覺 AI 好像馬上就要顛覆物理學了。然而事實真的是這樣嗎? 為了解答這個問題,人工智能領(lǐng)域?qū)<?Gary Marcus 與計算機科學教授 Ernest Davis 共同發(fā)表文章,分析了最近熱議的 AI 在物理領(lǐng)域的「跨界研究」,指出了其中的局限。
選自NAUTIL
作者:GARY MARCUS & ERNEST DAVIS機器之心編譯機器之心編輯部 文章表示,AI 破解的所謂「三體問題」其實只是三體問題的一個特例,在一般三體問題的求解道路上都還有很長的路要走,更別說其他更復雜的四體、五體問題了。論文作者和媒體都有夸大其詞的嫌疑。而所謂的「AI 哥白尼」更是一個噱頭,AI 所做的工作并不是所謂的「發(fā)現(xiàn)」,而是一些計算工作,定義物理問題、「發(fā)現(xiàn)物理規(guī)律」這種事還是需要人來完成。
以下是文章內(nèi)容:
AI 能否自學物理規(guī)律?深度神經(jīng)網(wǎng)絡(luò)能否迅速取代經(jīng)典計算機?如果從最近的新聞頭條標題來看,我們離這一天似乎已經(jīng)不遠了。在最近一篇應用 AI 求解三體問題的報道中,媒體給出的標題是「用神經(jīng)網(wǎng)絡(luò)解決三體問題,速度提升 1 億倍:機器學習為解決應用數(shù)學中的一大經(jīng)典問題提供了全新的解決方法」。
上個月,一篇文章指出,神經(jīng)網(wǎng)絡(luò)能以 1 億倍的速度解決三體問題。 在應用 AI 發(fā)現(xiàn)物理規(guī)律的報道中,一家媒體用到的標題是「有了機器學習,誰還需要哥白尼?」在關(guān)于此事的另一篇報道中,一位記者給出的標題是「AI 自學物理規(guī)律」,并將其描述為「AI 和物理學中值得紀念的時刻,」「可能成為解決量子力學問題的關(guān)鍵所在?!?/font>
在媒體的報道中,AI 已經(jīng)能夠自學物理學了。但問題在于,這些作者并未給出令人信服的證據(jù)。其實,這些說法和事實相去甚遠。所有這些報道都源自最近的兩項研究,它們利用機器學習來探索行星運行的不同方面。兩篇論文都是在嘗試有趣的創(chuàng)新,但二者的結(jié)果都沒有那么振奮人心。 這兩篇論文中夸大的觀點,以及圍繞它們進行的炒作,都是科學記者(有時是科學家自己)傾向于夸大 AI 和機器學習進展影響的表現(xiàn)。與往常一樣,在看到某個 AI 系統(tǒng)取得重大進展時,人們首先要問,「這個系統(tǒng)有什么用?」下面就來說說這兩項研究。牛頓都解決不了的三體問題,AI 能不能行?三體問題就是預測三個物體(通常是星球)在彼此的引力作用下如何運動的問題。如果空間中只有兩個物體,那么用牛頓證明過的定律就能解釋它們的運動,即它們會按照一個圓、橢圓或雙曲線的軌跡運動。但牛頓和其他科學家也證明過,如果空間中有三個或以上的物體,它們之間的相互運動就會變得異常詭異和復雜。沒有一個數(shù)學公式能表示這一運動,因此在一段較長的時間里精確預測物體的運動軌跡變得非常困難。三百年來,尋找求解三體問題的優(yōu)秀計算方法一直是困擾計算物理學家的一大難題。有關(guān)「AI 解決三體問題」的文章出自 arXiv 上一篇名為“Newton vs The Machine: Solving The Chaotic Three-Body Problem Using Deep Neural Networks”的論文(論文一)。通常來說,技術(shù)論文要比媒體文章謙遜許多。但作為一篇技術(shù)論文,這篇文章還是顯得「野心勃勃」。論文的最后一部分寫道,他們預測這項為一個狹窄案例開發(fā)的技術(shù)會擴展到一般三體問題,并最終用于解決四體、五體問題及其他混沌系統(tǒng)問題,這可能掀起一場巨大的變革。
但問題在于,作者并未給出有說服力的證據(jù)來證明這一點。其實,他們的研究甚至還沒有到覆蓋當下三體問題的完整范圍。相反,他們只是著眼于三體問題的一個特例,即三個質(zhì)量相同的粒子從特定位置開始運動,且初始速度為零。不僅如此,他們還完全依賴于傳統(tǒng)的物理引擎或模擬器,也就是說,沒有 AI,沒有機器學習,只有對運動微分方程的傳統(tǒng)數(shù)值解法,從 10000 個不同的起始點生成運動軌跡。接下來,他們用這個數(shù)據(jù)庫作為輸入來訓練神經(jīng)網(wǎng)絡(luò),然后在新的樣本上測試該網(wǎng)絡(luò)(新樣本的真實解也由模擬器算出)。結(jié)果發(fā)現(xiàn),該神經(jīng)網(wǎng)絡(luò)能夠以合理的準確率預測粒子的位置,而且速度比傳統(tǒng)模擬器快幾個數(shù)量級。本質(zhì)上來說,他們是將神經(jīng)網(wǎng)絡(luò)作為一種新的工具,從已知的值中進行插值,而這些已知的值是利用外部經(jīng)典系統(tǒng)算出的。與其他技術(shù)相比,神經(jīng)網(wǎng)絡(luò)可能更擅長于值的平滑空間插值問題,但大部分工作都是由外部先驗系統(tǒng)完成的。而且,重要的是,他們沒有證明同樣的插值方法在其他更復雜的現(xiàn)實世界物理問題中同樣奏效,即使在最簡單的情況下的證明都沒有(即改變粒子質(zhì)量),更不用說大于三的多體問題了。同時,從技術(shù)上來講,即使對于三體問題,他們解決的這類問題也只是一個簡單的子集(只有兩個自由度,一般三體問題有 10 個自由度)。在他們所解決的有限問題子集中,你只能決定第三個物體相對于前兩個物體的相對位置。在完整的三體問題中,你還可以選擇第二和第三個物體的質(zhì)量及初始速度,這些選擇中的每一個都可以從根本上改變系統(tǒng)隨時間變化的運動軌跡。我們知道,這種問題的復雜程度會隨著自由度數(shù)量的增加而呈指數(shù)級增加。因此他們所解決的問題的難度并不是一般多體問題的 1/5 那么簡單。而且,隨著粒子數(shù)量的增加,情況會迅速變得復雜起來:四體問題有 17 個自由度,五體問題有 24 個自由度,n 體問題 7n-11 個自由度……其次,如果只需要考慮兩個自由度,那么計算 1 萬個數(shù)據(jù)點就可以很好地覆蓋。就像你要繪制出山的形狀,那么你只需要測出 10,000 個點的海拔高度(即 100 x 100 的網(wǎng)格),就可以非??煽康毓浪愠鲞@兩個點之間任一點的海拔。然而,隨著維數(shù)(自由度)的增加,事情會變得更加復雜,平滑插值的可能性也隨之降低。第三,高度依賴初始條件,兩種略微不同的初始條件都可能導致完全不同的結(jié)果。這不是你所用的算法的局限,而是這類問題的固有屬性。所以聲稱機器學習能夠預測較長時間內(nèi)的混沌系統(tǒng)狀況就好比說它已經(jīng)能夠預測熱噪聲、放射性衰變這樣的隨機行為,無論用哪種算法,都是做不到的。大多數(shù)媒體忽略了這一點。一篇原載于 Popular Mechanics 的文章“Why Is the Three-Body Problem Unsolvable?”提出了這一點,當初始條件變得復雜時,結(jié)論尚有討論的空間。最后,論文中比較的對象也有缺陷。紐約大學數(shù)學系的 Jonathan Goodman 是動力學系統(tǒng)的專家,他表示,現(xiàn)代自適應方法可以比論文中引用的時序方法更快地計算這些軌跡(所以他們應該拿自適應方法進行對比),傳統(tǒng)的模擬器沒有多大用。那么,是否真的存在 AI 哥白尼?哥白尼項目的情況也好不到哪兒去。即將發(fā)表在 Physical Review Letters 上的一份研究(論文二)表明,研究者構(gòu)建了一種神經(jīng)網(wǎng)絡(luò),可以將物理過程中的數(shù)據(jù)作為輸入,從中提取決定性的關(guān)鍵參數(shù)。他們描述了四個涉及簡單物理系統(tǒng)的實驗,這些神經(jīng)網(wǎng)絡(luò)看起來效果很好。這項「在天文學領(lǐng)域重新發(fā)現(xiàn)哥白尼系統(tǒng)」的研究一度使得大眾媒體興奮不已。但問題在于,神經(jīng)網(wǎng)絡(luò)推斷出「地球和火星圍繞太陽運行」的說法完全是一種誤導。事實上,神經(jīng)網(wǎng)絡(luò)無法理解誰是圍繞誰運行的,它沒有幾何感知能力,也不知道旋轉(zhuǎn)意味著什么。在這里,神經(jīng)網(wǎng)絡(luò)所做的就是通過計算獲得兩個數(shù)值參數(shù),它并不知道這些數(shù)字代表了對固定中心點的角度。就神經(jīng)網(wǎng)絡(luò)而言,這些可能是隨時間變化的質(zhì)量、電荷,或者是來自兩個不同中心點的角度。機器獲得了數(shù)據(jù)源之間的相關(guān)性,但是卻無法推斷這些數(shù)據(jù)源與世界之間的關(guān)系。是人類科學家將其識別為從太陽測量的地球和火星的角度,并抽象出這樣的事實:這些數(shù)值應該被解釋為軌道。哥白尼發(fā)現(xiàn)的工作,事實上已經(jīng)被事先完成了,這個系統(tǒng)只是一個計算器,而不是一個物理規(guī)律發(fā)現(xiàn)者。此外,在作者生成的合成數(shù)據(jù)中,地球和火星在同一平面上以恒定速度繞圓形軌道運行。在實際的太陽系中,情況壓根就不是這樣:火星的軌道平面相對于地球的軌道(黃道)傾斜了 1.8 度。因此,火星對于固定位置恒星的運行方式不僅是一個東西向的圓,就像兩個軌道共面時一樣,也會以大約 4 度的角度南北偏轉(zhuǎn)。經(jīng)過數(shù)年觀察,火星在天空中的位置并不會是簡單的圓形路徑,它應該存在于 4°寬度的矩形空域中。哥貝尼真正的挑戰(zhàn)(早在現(xiàn)代計算機出現(xiàn)前就解決了,而且并沒有用到大數(shù)據(jù))要比神經(jīng)網(wǎng)絡(luò)處理的內(nèi)容復雜得多。