|
“代數(shù)拓?fù)涞恼Z言為什么這么古怪?它究竟在說些什么?我們?yōu)槭裁匆獙W(xué)習(xí)代數(shù)拓?fù)洌吭谟?jì)算機(jī)方面有什么實(shí)際應(yīng)用嗎?”發(fā)問的是一位少年,目光澄澈,表情無辜,雖然滿臉膠原蛋白,但是已經(jīng)稍顯謝頂?shù)膬A向,這是典型的早期男博士生的形象。 這些問題令老顧陷入深思。其實(shí)老顧內(nèi)心很清楚,如果這位同學(xué)潛心鉆研代數(shù)拓?fù)洌敲床怀鲆荒?,他自己?yīng)該可以完全回答前面幾個(gè)理論問題,假以時(shí)日,他自然會找到計(jì)算機(jī)方面的應(yīng)用。但是,令老顧糾結(jié)的是目前深度學(xué)習(xí)的方法迅猛發(fā)展,幾乎顛覆了計(jì)算機(jī)視覺領(lǐng)域的所有分支,那么是應(yīng)該讓這位同學(xué)潛心學(xué)習(xí)抽象的代數(shù)拓?fù)溥€是訓(xùn)練他實(shí)際的調(diào)參能力? 斟酌再三,老顧決定給這位同學(xué)講一下自己親身經(jīng)歷的一些計(jì)算機(jī)科學(xué)方面的研究項(xiàng)目,這些項(xiàng)目的關(guān)鍵思想來自代數(shù)拓?fù)?,再讓這位同學(xué)自行決定自己未來的道路。 人工智能的符號主義 在上一次人工智能的浪潮中,人們普遍認(rèn)可的方法是符號主義。人類的知識體系一直遵循著古希臘人創(chuàng)立的公理-定理體系,從顯而易見的基本事實(shí)開始搭建公理體系,用邏輯從公理推演,從而建筑宏偉的理論體系。從歐幾里得幾何學(xué)到牛頓力學(xué),直至廣義相對論,都是如此構(gòu)造。代數(shù)拓?fù)渥裱@一框架,從直觀的公理體系出發(fā),通過嚴(yán)格的代數(shù)運(yùn)算來推演一切定理。 如果將公理符號化,用邏輯代數(shù),我們可以計(jì)算出來理論體系中的所有定理。因此,人們認(rèn)為智慧在很大層面上就是邏輯推理。人工智能的主要目標(biāo)之一就是開發(fā)各種算法來實(shí)現(xiàn)自動(dòng)推理。這方面的最為成功的領(lǐng)域是機(jī)器定理證明,其中最為杰出的代表是吳文俊先生所創(chuàng)立的“吳方法”。這里的基本思想是將條件和結(jié)論都表述成多元多項(xiàng)式,然后判斷結(jié)論多項(xiàng)式是否在條件多項(xiàng)式生成的理想里面。應(yīng)用吳方法,計(jì)算機(jī)完全可以自動(dòng)證明歐幾里得幾何學(xué)中的所有定理。后來,吳先生的高足高曉山研究員推廣出“微分結(jié)式”方法,從而可以用計(jì)算機(jī)證明局部微分幾何的定理,例如從黎曼度量得到高斯曲率公式。 老顧有幸有機(jī)會和高曉山教授、王東明院士請教機(jī)器定理證明的問題。他們認(rèn)為目前機(jī)器定理證明依然無法證明整體微分幾何定理,例如著名的高斯-博納定理,即高斯曲率在整個(gè)曲面上的積分和歐拉示性數(shù)的關(guān)系。陳省身先生曾經(jīng)指出從局部微分幾何到整體微分幾何的橋梁在于代數(shù)拓?fù)洹H绻麢C(jī)器定理證明方法能夠證明代數(shù)拓?fù)涠ɡ?,那么整體微分幾何定理就可以被計(jì)算機(jī)自動(dòng)證明。 人工智能的聯(lián)結(jié)主義 目前我們所處的人工智能浪潮以聯(lián)結(jié)主義為主,人們更加注重相關(guān)性而非因果性,用聯(lián)合概率分布來取代傳統(tǒng)的定理、定律,并在圖像、語音、文本處理等很多方面取得了突破性進(jìn)展。深度學(xué)習(xí)方法的理論根基在于統(tǒng)計(jì)概率分布的表示和變換。那么,概率分布變換的最為基本而普適的理論自然是最優(yōu)傳輸理論(Optimal Mass Transportation Theory)。 圖1. 最優(yōu)傳輸映射可以實(shí)現(xiàn)流形上概率分布的變換。 最優(yōu)傳輸理論被廣泛應(yīng)用于生成模型(Generative Model),例如近年來非常熱門的對抗-生成網(wǎng)絡(luò)(Generative-Adverserial Networks)。最優(yōu)傳輸理論涉及到蒙日-安培方程(Monge-Ampere Equation),從而有一個(gè)非常直觀的幾何解釋:閔可夫斯基(Minkowski)問題和亞歷山大(Alexandroff)問題。 圖2. Alexandroff問題。 Alexandroff問題如圖2所示,給定三維歐氏空間中的一族平面,平面的法向量固定,但是高度未知,這些平面的“上包絡(luò)”構(gòu)成一個(gè)開放的凸多面體。凸多面體向平面圓盤投影,構(gòu)成圓盤的剖分,每個(gè)胞腔的面積給定,試問凸多面體是否存在,是否唯一。Alexandroff在1950年代證明了對于任意給定的胞腔投影面積,如果這些投影面積之和等于圓盤面積,那么凸多面體存在,并且彼此相差一個(gè)垂直平移。 Alexandroff的證明是基于代數(shù)拓?fù)渲械?span>區(qū)域不變性定理 (invariance of domain):假設(shè) Alexandroff的證明思路如下:設(shè)平面族為
顯然這個(gè)映射是連續(xù)映射。由Brunn-Minkowski不等式,可以證明 共形模問題
圖3. 共形變換:狹縫映射。 圖3顯示了共形變換中的狹縫映射(slit mapping)。給定一個(gè)帶黎曼度量的曲面,虧格為0,帶有多個(gè)邊界,則存在一個(gè)共形映射,將曲面映到單位平面環(huán)帶,兩條邊界映成內(nèi)圓和外圓,其他邊界映成同心圓?。íM縫),并且這種映射彼此相差一個(gè)旋轉(zhuǎn)。這種映射的存在性依賴于Hodge理論:黎曼流形上橢圓型偏微分方程解的空間維數(shù)等于相應(yīng)上同調(diào)群的維數(shù)。
圖4. 曲面上的全純微分。 假設(shè)共形狹縫映射
圖5. 圓域映射。 圖5顯示了另外一種典范映射,圓域映射,就是將0虧格多聯(lián)通曲面映到單位圓環(huán)上,每條邊界映射歐氏圓。我們需要證明這種映射的存在性和唯一性。由狹縫映射的存在性,我們知道曲面可以映到狹縫區(qū)域,如果每個(gè)狹縫區(qū)域能夠貢獻(xiàn)映射到平面圓域,那么定理得證。我們考察從圓域到狹縫區(qū)域的共形映射:
在圓域中,每個(gè)小圓用圓心和半徑
如果兩個(gè)圓域之間存在共形映射,我們將圓域關(guān)于其內(nèi)部邊界反演,根據(jù)Schwartz反射原理(Schwartz Reflection Principle),我們可以將共形映射拓展到反射像上。重復(fù)反演過程,直至填滿整個(gè)圓盤,那么延拓后的共形映射必為恒同映射,這意味著初始的兩個(gè)圓域重合。由此,我們可以證明從圓域到狹縫域的映射 離散黎奇流 黎奇流方法是一種強(qiáng)有力的計(jì)算方法,給定目標(biāo)曲率,它可以算出相應(yīng)的黎曼度量。假設(shè)給黎曼度量曲面
設(shè)共形因子函數(shù)為
共形因子可以由Ricci 流方法算出,
在計(jì)算機(jī)應(yīng)用中,我們用離散的三角網(wǎng)格來逼近曲面,用邊長來定義離散黎曼度量,用角欠(angle deficit,即每個(gè)頂點(diǎn)周角和與平面周角和之差差)來定義離散高斯曲率。我們在頂點(diǎn)集合上定義離散共形因子函數(shù),離散度量的共形變換定義為 在實(shí)際應(yīng)用中,我們發(fā)現(xiàn)了嚴(yán)重的問題。在流的過程中,經(jīng)常會出現(xiàn)某些三角形退化,其邊長的三角形不等式不再成立,Ricci流無以為繼,以失敗而告終。那么哪些目標(biāo)曲率能夠達(dá)到,流過去的路徑是否存在,如何設(shè)計(jì)這種路徑,這些問題必須得到完滿回答,否則算法不具有實(shí)用價(jià)值。后來經(jīng)過大量實(shí)驗(yàn),我們發(fā)現(xiàn)原來思想上的有一個(gè)誤區(qū),那就是保持曲面的組合結(jié)構(gòu)不變,如果我們?nèi)菰S在流的過程中三角剖分動(dòng)態(tài)變化,始終和當(dāng)前的度量保持Delaunay關(guān)系,那么離散Ricci流從來不會退化。但是,我們需要嚴(yán)格證明在這種流下,算法能夠到達(dá)目標(biāo)曲率,換言之,我們需要證明離散黎奇流解的存在性。 這一證明非常困難,因?yàn)閺某跏祭杪攘坑袩o窮多種路徑到達(dá)目標(biāo)度量,依循不同的路徑,三角剖分非發(fā)生復(fù)雜的變化,我們需要證明目標(biāo)度量下所有幾何量和組合結(jié)構(gòu)和路徑選取無關(guān)。最終我們要證明從離散共形因子
是連續(xù)單射,根據(jù)區(qū)域不變定理,這個(gè)映射是滿射,因此對于任意目標(biāo)曲率滿足高斯-博納條件,離散共形度量存在。
圖6. 單值化定理。 這一定理可以推出離散單值化定理,即所有曲面可以配備三種標(biāo)準(zhǔn)度量中的一種:球面,歐氏或者雙曲度量。 直覺與反直覺 通過上面的幾個(gè)例子,我們看到代數(shù)拓?fù)涫谴嬖谛宰C明的強(qiáng)有力的工具,對于很多非?;镜膸缀嗡惴?,其解的存在性和計(jì)算穩(wěn)定性都需要代數(shù)拓?fù)渥鳛槔碚撝巍T诳蒲兄?,我們頻繁使用區(qū)域不變定理,這一定理貌似簡單,但是其證明非常艱深,并且這種艱深是來自深刻概念上的艱深。這一定理來自若當(dāng)分離定理(Jordan Separation theorem),若當(dāng)定理是老顧見過的最為“大智若愚”的定理。
圖7. 若當(dāng)曲線定理。 如圖7所示,若當(dāng)曲線定理(Jordan Curve Theorem)說平面上一條連續(xù)封閉簡單曲線(無自交點(diǎn))將平面分成兩個(gè)分離的連通子集,內(nèi)部和外部。每個(gè)子集自身都是道路連通的,但是彼此分離。這一定理非常符合人類直覺,以至于我們覺得它是不辯自明的。我們無法確認(rèn)這一事實(shí)是一條定理,還是一條公理。人類也是經(jīng)歷了漫長歲月,才意識到這一事實(shí)需要嚴(yán)格證明,又花費(fèi)了漫長歲月才真正給出嚴(yán)格的證明。那么,我們?yōu)槭裁葱枰萌绱嘶逎恼Z言來證明如此顯而易見的事實(shí)呢?難道是出于數(shù)學(xué)家的孤芳自賞嗎? 真正的原因在于人類的直覺并不可靠,很多貌似合理的論斷都是似是而非的謬論。另一方面,人類在拓?fù)浞矫娴闹庇X相對有限,高維情形很難建立起來想像力,唯一能夠把握的只有嚴(yán)格的數(shù)學(xué)推導(dǎo)。比如,我們觀察圖7,Jordan曲線將平面分成道路連通的兩部分,每一部分都是單連通的,亦即在曲線內(nèi)部(或者外部)的任意封閉曲線都可以在內(nèi)部(或者外部)逐漸縮成一個(gè)點(diǎn)。這一觀察也非常符合直覺。這被稱為是Schonflies定理。但是當(dāng)我們將這兩個(gè)結(jié)論推向高維的時(shí)候,我們發(fā)現(xiàn)直覺起不了太大作用,Jordan分離定理可以被推廣,但是Schonflies定理在三維的時(shí)候就已經(jīng)失效。 那么,我們?yōu)槭裁催@么重視如此反直覺的拓?fù)涠ɡ??因?yàn)檫@個(gè)古怪的定理可以推出區(qū)域不變性定理,而區(qū)域不變性定理可以證明大量計(jì)算機(jī)算法解的存在性,是計(jì)算機(jī)科學(xué)不可或缺的理論基礎(chǔ)。 小結(jié) 代數(shù)拓?fù)浞浅3橄螅巧铄鋬?yōu)美,為工程應(yīng)用提供了理論基礎(chǔ)。從增強(qiáng)學(xué)術(shù)修養(yǎng)角度而言,也是值得學(xué)習(xí)。代數(shù)拓?fù)涞乃枷胧址▽τ谘芯糠栔髁x的人工智能非常有意義,她為我們提供了一個(gè)不同的視角來思考如何定義智能。 目前計(jì)算機(jī)技術(shù)發(fā)展非常迅猛,因此在一定程度上理論分析相對滯后。很多學(xué)生忽視理論修養(yǎng)的培養(yǎng),將有限的精力全部投入到無限的調(diào)參上去,這種學(xué)習(xí)方法值得商榷。例如,在Wasserstein GAN中,有一個(gè)廣為人知的困難:如果概率分布的支集(support)具有多個(gè)連通分支,那么GAN的訓(xùn)練收斂非常困難。很多學(xué)生百折不撓地調(diào)整參數(shù),試圖解決這一問題。根據(jù)我們的理論結(jié)果,在這種情形下,最優(yōu)傳輸映射無法被深度神經(jīng)網(wǎng)絡(luò)表示,換言之,在DNN的框架下,解并不存在,因此工程上無論如何努力,也彌補(bǔ)不了理論的缺陷。 看著少年漸漸深入深思,老顧相信他會潛心研究代數(shù)拓?fù)涞?。老顧知道他的精神必將會?jīng)歷一次深刻的洗禮。希望未來有一天,他能夠用代數(shù)拓?fù)浣o出某個(gè)算法解的存在性證明 ...... |
|
|