|
現代理論物理學中最具挑戰(zhàn)性的問題之一就是所謂的多體問題。典型的多體系統(tǒng)是由大量強相互作用的粒子組成的。很少有這樣的系統(tǒng)能夠被數學精確地處理。然而,由于指定一個通用多體量子態(tài)所需的資源以指數方式依賴于系統(tǒng)中粒子的數量(更準確地說,是自由度的數目),即使是當今最好的超級計算機也不具足夠的算力來精確編碼這些狀態(tài)(它們只能處理小于45個粒子的相對較小的系統(tǒng))。 正如我們將看到的,機器學習技術(特別是人工神經網絡)的最新應用已被證明能夠提供這種復雜狀態(tài)的高效表示,使其易于計算。 在這篇文章中,我將討論如何應用人工神經網絡來表示多個粒子的量子態(tài)。從下面三個方面討論:
序言愛因斯坦的科學合作者之一、波蘭物理學家利奧波德·因菲爾德(Leopold Infeld)在他的自傳中講述了一個引人入勝的故事。
根據因菲爾德的說法,在他和愛因斯坦花了幾個月時間進行漫長而艱苦的計算后,愛因斯坦說了這樣的話:
愛因斯坦的意思是,人類必須依靠復雜的計算和推理來解決復雜的物理問題,而大自然不需要。 多體的問題正如前面提到的,理論物理學中一個眾所周知的難題是多體問題。這個問題已經在經典系統(tǒng)(基于牛頓三大運動定律及其改進的物理系統(tǒng))和量子系統(tǒng)(基于量子力學定律的系統(tǒng))中研究了很長時間。 第一個被廣泛研究的(經典的)多體問題是涉及地球、月球和太陽的三體問題。 第一批攻克這一多體問題的科學家之一正是艾薩克·牛頓,他在其杰作《數學原理》中寫道:
因為本質上所有相關的物理系統(tǒng)都是由一系列相互作用的粒子組成的,所以多體問題是極其重要的。 定義我們可以把這個問題定義為“研究物體之間相互作用對多體系統(tǒng)行為的影響”。
在這個語境中,“多”的意思可以是3到無窮之間的任何數字。在N=5的自旋激發(fā)下,已經發(fā)現了量子多體行為的特征:
在這篇文章中,我將關注量子多體問題。 量子多體系統(tǒng)量子多體系統(tǒng)的復雜性早在20世紀30年代就被物理學家們發(fā)現了。當時,偉大的物理學家保羅·狄拉克(Paul Dirac)設想了量子力學的兩個主要問題。
根據他的說法,第一個問題是“與該理論與相對論思想的精確契合有關”。第二,“這些(量子)定律的精確應用,會導致過于復雜而難以解出的方程式”。第二個問題正是量子多體問題。 幸運的是,許多物理系統(tǒng)的量子態(tài)可以用比希爾伯特空間最大容量少得多的信息來描述。這一事實被一些數值技術所利用,包括著名的量子蒙特卡羅法(QMC)。 量子波函數簡單地說,量子波函數在數學上描述了量子系統(tǒng)的狀態(tài)。第一個得到精確數學處理的量子系統(tǒng)是氫原子。
一般來說,一個量子態(tài)用一個復概率振幅Ψ(S)表示,其中參數S包含了關于系統(tǒng)狀態(tài)的所有信息。例如,在自旋1/2鏈中:
從Ψ(S)可以導出與系統(tǒng)測量相關的概率。例如,正實數Ψ(S)的模方給出了與Ψ(S)相關的概率分布: 哈密頓算符量子系統(tǒng)的性質由系統(tǒng)的哈密頓算符H封裝,后者是兩項的和:
量子系統(tǒng)的允許能級(它的能譜)可以通過求解所謂的薛定諤方程得到,這是一個描述量子力學系統(tǒng)行為的偏微分方程。
薛定諤方程的時間無關版本由下列特征值系統(tǒng)給出:
特征值和對應的特征態(tài)為:
最低的能量對應于系統(tǒng)的“基態(tài)”。 一個簡單的例子為了具體起見,讓我們考慮以下例子——量子諧振子。QHO是經典諧振子(見下圖)的量子力學對應物,經典諧振子是一個系統(tǒng),當它從初始位置被移到平衡位置時,會受到一個力的作用。
下面的動畫比較了簡諧振子的經典和量子概念。
一個具有明確軌跡的簡單振動質量代表了經典系統(tǒng)(上圖中的A塊和B塊),而相應的量子系統(tǒng)則用一個復波函數來表示。在每個區(qū)塊中(從C開始)有兩條曲線,藍色的是Ψ的實部,紅色的是虛部。 量子自旋系統(tǒng)在量子力學中,自旋可以大致理解為粒子和原子核所攜帶的“角動量的內在形式”。雖然直覺上認為自旋是一個粒子圍繞自己的軸旋轉,但這并不完全正確,因為粒子會以比光速還快的速度旋轉,這違反了基本的物理原理。自旋是沒有經典對應物的量子力學物體。
量子自旋系統(tǒng)與磁性現象密切相關。磁鐵是由原子組成的,原子通常是小磁鐵。當這些原子磁體變成平行定向時,就產生了我們所熟悉的宏觀效應。
現在,我將簡要介紹機器學習算法的基本組成部分,以幫助讀者理解它們與量子系統(tǒng)的聯(lián)系。 機器學習=機器+學習機器學習方法有兩個基本組成部分:
神經網絡人工神經網絡通常是非線性多維嵌套函數。它們的內部工作只是啟發(fā)式地理解,研究它們的結構并不能產生關于它所近似的函數的見解。
由于網絡參數和被近似的數學函數之間缺乏明確的聯(lián)系,神經網絡通常被稱為“黑盒子”。 有幾種類型的人工神經網絡,但本文將集中討論受限玻爾茲曼機(RBM)的具體情況。 什么是受限玻爾茲曼機?受限玻爾茲曼機可以生成隨機神經網絡。它們有很多應用,包括:
受限玻爾茲曼機屬于一類基于能量的模型。它們不同于其他神經網絡,后者根據輸入估計一個值,而受限玻爾茲曼機估計輸入的概率密度(它們估計許多點,而不是單個值)。 受限玻爾茲曼機有以下屬性:
最小化的能量泛函為:
可見單元和隱藏單元的聯(lián)合概率分布為:
其中歸一化常數Z稱為配分函數。追蹤隱藏的單位,我們得到一個可見(輸入)向量的邊際概率:
因為,如前所述,隱藏(可見)單元激活是相互獨立的,給定可見(隱藏)單元激活可以寫作:
并且:
最后,激活概率為:
其中σ為sigmoid函數。 訓練步驟如下:
受限玻爾茲曼機如何學習重構數據受限玻爾茲曼機執(zhí)行一個稱為“重構”的無監(jiān)督過程。它們通過在兩層之間進行長時間的連續(xù)傳遞來重構數據。在向后傳遞中,如下圖所示,隱藏層中節(jié)點的激活函數成為新的輸入。
這些輸入的乘積和各自的權重被求和,并且來自可見層的新的偏差b被添加到每個輸入節(jié)點。這種操作產生的新輸出稱為“重構”,因為它是原始輸入的近似。 自然,重構和原始輸入在一開始是非常不同的(因為w的值是隨機初始化的)。然而,由于誤差被重復反向傳播到w,它逐漸被最小化。 因此,我們認為:
將兩個條件分布連接起來,得到x和a的聯(lián)合概率分布,即受限玻爾茲曼機學會了如何逼近原始數據(輸入的結構)。 如何將機器學習和量子系統(tǒng)連接起來?在《科學》雜志上的一篇文章中,卡萊奧和泰勒提出可以把量子多體系統(tǒng)的量子波函數Ψ(S)當作一個黑盒,然后用受限玻爾茲曼機來近似它。通過優(yōu)化受限玻爾茲曼機的參數,將其訓練成Ψ(S)。
問題是如何將(與時間無關的)薛定諤方程作為一個特征值問題重新表述為一個機器學習問題。 變分法事實證明,答案早已為人所知,它基于所謂的變分法,這是波動方程的另一種形式,可以用來獲得量子系統(tǒng)的能量。利用該方法,我們可以將優(yōu)化問題寫成:
其中 E[Ψ]是一個依賴于特征態(tài)和哈密頓量的泛函。通過求解這一優(yōu)化問題,我們得到了基態(tài)能量及其相應的基態(tài)。 量子態(tài)與受限玻爾茲曼機在卡萊奧和泰勒的論文中,受限玻爾茲曼機被用來表示量子態(tài)Ψ(S)。他們推廣了受限玻爾茲曼機以考慮復雜的網絡參數。 很容易證明能量泛函可以寫成:
其中,最后一個等號后的期望值的參數是局部能量。然后利用隨機重構方法對神經網絡進行訓練。相應的優(yōu)化迭代為:
其中η是學習率,S是隨機重構矩陣,它依賴于特征態(tài)及其對數導數。 受限玻爾茲曼機對自旋1/2的量子系統(tǒng)特別感興趣,他們將量子態(tài)寫成如下:
在這個表達式中,Ψ的W參數是一組參數:
其中a和b上的分量是實數,但W可以是復數。由于缺少層內交互作用,受限玻爾茲曼機架構的典型特點是允許隱藏變量消失,將上面的表達式大大簡化為:
要訓練量子波函數,必須遵循類似的過程。 結論在這篇簡短的文章中,我們看到限制玻爾茲曼機器(RBM),一種簡單的人工神經網絡,可以用來計算非常高精度的基態(tài)能量的多粒子量子系統(tǒng)。 |
|
|