|
顧險(xiǎn)峰(紐約州立大學(xué)石溪分校終身教授) 引言 依隨智能手機(jī)的大規(guī)模普及,數(shù)字?jǐn)z影已經(jīng)成為很多人生活中不可或缺的習(xí)慣。隨著數(shù)字圖像處理技術(shù)的蓬勃發(fā)展,PS作為數(shù)字圖像處理的代名詞(photoshop),在普羅大眾中早已耳熟能詳。數(shù)字圖像處理中,最為基本的算法非“色彩變換”(Color Transfer)莫屬。
直方圖均衡化是提高灰度圖像對(duì)比度的常見算法。如圖1所示,左側(cè)輸入圖像的灰度分布在一個(gè)狹窄區(qū)域,朦朧昏暗;右側(cè)是直方圖均衡化的結(jié)果,清晰明亮,對(duì)比鮮明。我們?cè)O(shè)輸入圖像像素的灰度為一隨機(jī)變量,其取值范圍為單位區(qū)間 圖2. 基于最優(yōu)傳輸?shù)纳首儞Q。 數(shù)據(jù)驅(qū)動(dòng)的色彩變換可以視作是直方圖均衡化的直接推廣。圖2顯示了一個(gè)算例,左側(cè)是輸入圖像,陰霾遍布下的麥地,陰郁蒼涼,中間是范例圖像,晴空下的麥穗,右圖是輸出圖像,一掃陰霾,麥浪金黃,明媚爽朗。我們將圖像中的每個(gè)像素顏色表示成(紅,綠,藍(lán))三元組,所有可能的顏色空間
圖3. 輸入圖像。
圖4. 范例圖像。
圖3至圖5展示了另外一個(gè)例子,輸入圖像顏色的概率測(cè)度變換成范例圖像顏色的概率測(cè)度,從而生成了輸出圖像。圖6的鸚鵡圖像也進(jìn)行了顏色變換。
這些顏色變換的算法是基于最優(yōu)傳輸理論(Optimal Mass Transportation)。最近,最優(yōu)傳輸理論被廣泛應(yīng)用于工程和醫(yī)療中的諸多領(lǐng)域,例如直接應(yīng)用于圖像顏色變換、圖像注冊(cè)、曲面保面積參數(shù)化和體的保體元參數(shù)化、曲面或體的注冊(cè)。特別是在機(jī)器學(xué)習(xí)中,最優(yōu)傳輸理論起到了至關(guān)重要的作用。下面我們簡(jiǎn)單介紹最優(yōu)傳輸理論梗概。 蒙日關(guān)于最優(yōu)傳輸問題的提法 假設(shè)
歷史上,法國(guó)數(shù)學(xué)家蒙日(Monge)早在1781年就提出了最優(yōu)傳輸問題,我們?cè)谶@里稱之為蒙日問題:求保測(cè)度的具有最小傳輸代價(jià)的映射
這一問題的提法非常具有普適性,特別是它具有天然的經(jīng)濟(jì)學(xué)意義。 我們可以用下面的例子來理解最優(yōu)傳輸問題的提法:假設(shè)空間 蒙日提出的傳輸代價(jià)是 康塔洛維奇的提法 蒙日的提法中,保測(cè)度的映射所構(gòu)成的空間不具備緊性,這為問題的解決帶來了本質(zhì)的難度。1939年,俄羅斯數(shù)學(xué)家康塔洛維奇(Kantorovich)將傳輸映射(transportation map)推廣為傳輸方案(transportation plan),從而巧妙地將問題轉(zhuǎn)化,帶來實(shí)質(zhì)性的突破。 在蒙日的傳輸映射 為了表達(dá)傳輸方案,康塔洛維奇在空間
那么如上邊際概率條件可以表示為:
康塔洛維奇關(guān)于最優(yōu)傳輸問題的提法如下: 我們可以看到可容許概率測(cè)度 康塔洛維奇將空間
雖然理論上線性規(guī)劃問題的復(fù)雜度為NP,實(shí)際中,我們可以用經(jīng)典的單純形法或者內(nèi)點(diǎn)法快速解出。 鑒于最優(yōu)傳輸問題的巨大經(jīng)濟(jì)價(jià)值,康塔洛維奇獲得了1975年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。 對(duì)偶提法 康塔洛維奇的提法將最優(yōu)傳輸問題轉(zhuǎn)化成凸限制下的線性優(yōu)化問題,這個(gè)問題存在對(duì)偶的提法。我們可以從對(duì)偶問題上看出更多的幾何直覺。我們將邊際概率測(cè)度的限制條件換種方式表達(dá),考察下面的泛函:
這里
注意,在這里測(cè)度 在特定條件下,我們可以交換極小,極大算子,從而得到:
我們?cè)倏疾旌笠豁?xiàng)
如果在某一點(diǎn)
這里 通常情況下,蒙日泛函,對(duì)偶泛函和康塔洛維奇泛函滿足不等式,
問題的核心在于:何時(shí)等號(hào)成立?何時(shí)最優(yōu)傳輸方案稱為最優(yōu)傳輸映射? 勒讓德變換-包絡(luò) 對(duì)偶問題具有非常直觀的幾何洞察,為此我們先考察凸幾何中的勒讓德變換(Legendre transform)。
如圖9所示,假設(shè)
這里截距定義為:
我們可以將勒讓德變換進(jìn)行推廣,如圖10所示,假設(shè)
這里,我們稱
如果 對(duì)偶問題(DP)可以進(jìn)一步表示成如下形式:
扭曲條件 根據(jù)以上的討論,我們看到對(duì)于最優(yōu)傳輸方案
換言之 根據(jù)包絡(luò)的幾何特征,假設(shè)在
我們得到映射 ,如果這一映射對(duì)任意 圖11展示了一個(gè)不滿足扭曲條件的例子,在 假如,代價(jià)函數(shù)
這里,我們?cè)僖淮斡玫搅死兆尩伦儞Q 作為這套理論的應(yīng)用,我們給出兩個(gè)在日常生活中最為常見的例子。 蒙日-安培方程 考察代價(jià)函數(shù)為
則h為嚴(yán)格凸的函數(shù),最優(yōu)傳輸映射存在。如果我們考慮
我們令 我們?cè)倏紤]保持測(cè)度的性質(zhì):
因此,最優(yōu)傳輸映射和蒙日-安培方程具有非常親密的血緣關(guān)系,而后者也和傳統(tǒng)的閔科夫斯基問題(Minkowski Problem)有很深的淵源[5]。 加權(quán)Voronoi圖 從計(jì)算角度講,最優(yōu)傳輸映射和計(jì)算幾何中的加權(quán)Voronoi圖(Power Voronoi Diagram)是彼此等價(jià)的。我們?cè)谶@里進(jìn)行一番推導(dǎo)。 我們?cè)O(shè)
配備狄拉克測(cè)度:
考察對(duì)偶問題,則
我們?cè)诳疾?/span>
固定
我們得到
這里 由此,我們得到對(duì)偶問題為:最大化如下能量
我們可以用爬山法來進(jìn)行優(yōu)化。圖12,13顯示了保面元和保體元的同胚映射,其計(jì)算就是基于這個(gè)算法。更多的計(jì)算工具,數(shù)據(jù)測(cè)試集合可以在[2]中找到。
圖12. 曲面保面積參數(shù)化[4]。
小結(jié) 一個(gè)黎曼流形上的所有概率測(cè)度構(gòu)成一個(gè)無窮維的流形,即所謂的Wasserstein空間。任意兩個(gè)概率測(cè)度之間存在最優(yōu)傳輸映射,這個(gè)映射的傳輸代價(jià)給出了兩個(gè)概率測(cè)度之間的距離,被稱為是Wasserstein距離。因此,Wasserstein空間是一個(gè)黎曼流形。 在工程和醫(yī)學(xué)的諸多領(lǐng)域,算法的核心是尋找一個(gè)概率測(cè)度,例如機(jī)器學(xué)習(xí)算法。Wasserstein距離給出了衡量概率測(cè)度相似程度的嚴(yán)密方法,這是為什么近幾年來最優(yōu)傳輸理論異?;馃岬母驹颉?br> 但是,計(jì)算最優(yōu)傳輸本身并不容易,目前計(jì)算機(jī)視覺、圖形學(xué)、機(jī)器學(xué)習(xí)、醫(yī)學(xué)圖像的研究者都努力用各種優(yōu)化方法,工程技巧來提高計(jì)算效率。我們可以預(yù)見在不久的將來,最優(yōu)傳輸理論將會(huì)在更多的實(shí)際工程中大放異彩。 (丘成桐先生邀請(qǐng)杜克大學(xué)的劉建國(guó)教授在清華大學(xué)數(shù)學(xué)科學(xué)中心,于2016年暑期學(xué)校,講述最優(yōu)傳輸理論課程[1]。本文根據(jù)課堂筆記整理而成。筆者鳴謝丘成桐先生和劉建國(guó)教授。) [1] Fillipo Santambrogio, Optimal Transport for Applied Mathematicians - Calculus of Variations, PDEs and Modeling [2] http://www3.cs./~gu/software/omt/index.html [3] Kehua Su, Wei Chen, Na Lei, Junwei Zhang, Kun Qian and Xianfeng Gu, Volume Preserving Mesh Parameterization based on Optimal Mass Transportation, Journal of Computer-Aided Design (CAD), 2016. [4] Xin Zhao, Zhengyu Su, Xianfeng David Gu, Arie Kaufman, Jian Sun, Jie Gao, Feng Luo, Area-preservation Mapping using Optimal Mass Transport, IEEE TVCG, 19(12), Pages 2838-2847, 2013. [5] Xianfeng Gu, Feng Luo, Jian Sun and Shing-Tung Yau, Variational Principles forMinkowski Type Problems, Discrete Optimal Transport, and Discrete Monge-Ampere |
|
|