|
01 火星人臉 人類對(duì)外星文明的尋找和癡迷自古就有記載。所以,每每看到拍攝于外星球的照片,必然會(huì)情緒激動(dòng),試圖從中獲取存在外星人的蛛絲馬跡。 圖1(a)是一張1986年美國(guó)“海盜1號(hào)”火星探測(cè)器在火星“西多尼亞”地區(qū)拍攝的照片。如果直接對(duì)圖做分析,即使用到上文講過(guò)的先驗(yàn)知識(shí),也不太容易發(fā)現(xiàn)什么信息。 不過(guò),圖像處理工作者多少懂點(diǎn)PS,會(huì)對(duì)圖像先做些處理。首先,這張圖像比較偏暗,先得讓圖像變亮點(diǎn),得到圖1(b)。其次,早期火星探測(cè)器拍攝的照片易受設(shè)備或其它電磁干擾影響,會(huì)在圖像上產(chǎn)生一些白點(diǎn)和黑點(diǎn),即圖像屆俗稱的“鹽”和“胡椒”組成的椒鹽噪聲,如圖1(b)。這類噪聲由于處在圖像像素亮度的兩個(gè)極端,比較容易通過(guò)圖像處理技術(shù)消解,得到圖1(c)。而圖1(c)的亮度過(guò)于集中在灰色區(qū)域,需要用相應(yīng)的技術(shù)將圖像亮度的變化或動(dòng)態(tài)范圍擴(kuò)大,以便于人類更方便感知其中的差異,于是有了廣為流傳的圖1(d)。 圖1 火星人臉的圖像處理過(guò)程 圖1(d)是曾經(jīng)很著名的“火星人臉”。據(jù)小道消息,當(dāng)年前蘇聯(lián)的一群“科學(xué)家”們從美國(guó)宇航局公開(kāi)的網(wǎng)站上拿到一組火星照片,對(duì)原始圖片進(jìn)行類似上述的處理后便得到了這張照片。大家非常激動(dòng),因?yàn)閳D上有一張看似立體的人臉,眼睛、鼻子、嘴巴都非常逼真。可是按拍攝的距離和目標(biāo)比例來(lái)估計(jì),顯然不可能是人力可為之,更何況有記載的人類文明從未有人去過(guò)火星。他們便推測(cè)這可能是外星人留下的遺跡。盡管美國(guó)宇航局一直強(qiáng)調(diào),這只是光學(xué)和圖像后處理的視覺(jué)錯(cuò)覺(jué)。但在當(dāng)時(shí),這種強(qiáng)調(diào)被認(rèn)為是刻意掩蓋外星文明的陰謀論。 從那時(shí)開(kāi)始,媒體對(duì)火星人的幻想一直持續(xù)不斷,前前后后拍過(guò)的經(jīng)典電影不少。有與火星人發(fā)生戰(zhàn)爭(zhēng)的《火星人玩轉(zhuǎn)地球》和《世界之戰(zhàn)》,也有幻想和平相處的,如2000年拍攝的、圍繞火星人臉和火星文明展開(kāi)的《火星任務(wù)》。 為了能“走近科學(xué)”,答疑解惑,美國(guó)宇航局后來(lái)又做了幾次火星探索。1998和2001年對(duì)火星人臉位置進(jìn)行了再次偵測(cè)。從發(fā)回的照片看,“火星人臉”只是一座普通的山丘,如圖2(a)-(c)所示。但由于當(dāng)時(shí)火星正值多云天氣,照片效果不佳,大眾并不認(rèn)可其結(jié)論。2015年7月,歐洲宇航局“火星快車”探測(cè)器飛越火星“人臉”上空時(shí),拍下幾幅高清晰照片。其拍攝的3D成像照片清楚地呈現(xiàn)了火星人臉的地形,如圖2(d)所示。它表明在其他角度觀察“火星人臉”時(shí),并沒(méi)有任何人臉的特征在上面,只是自然界腐蝕的結(jié)果而已。 圖2 不同年代、不同角度下的火星人臉 通過(guò)這些努力,多少打消了大家對(duì)火星人的幻想。2015年的電影《火星救援》更是把火星描繪成荒無(wú)人煙的沙漠。主人公馬克因意外不得不獨(dú)自火星上生存,在絕對(duì)的孤獨(dú)中只能靠刺激感官的搖滾和迪斯科音樂(lè)來(lái)振作精神。比如,他在改裝戰(zhàn)神四號(hào)準(zhǔn)備逃離火星時(shí),聽(tīng)著與披頭士齊名的、ABBA樂(lè)隊(duì)1974年成名曲“Waterloo”(滑鐵盧)。 不過(guò),上個(gè)月底(2018年7月30日)在火星南極發(fā)現(xiàn)了巨大的地下湖,又讓人對(duì)火星生命產(chǎn)生了新的希望和聯(lián)想。 然而,不管有沒(méi)有火星人,“火星人臉”的視覺(jué)錯(cuò)覺(jué)來(lái)源于兩個(gè)因素,一是人對(duì)人臉的先驗(yàn)知識(shí),另一個(gè)是陰影幫助人們建立的立體視覺(jué)。 陰影 陰影是日常生活最常見(jiàn)的。太陽(yáng)升起來(lái),照在桑干河上,河邊的景物便有了影子。 圖3 陰影的形成與分類[1] 一般來(lái)說(shuō),陰影有四類,如圖3所示。光照在物體上,被物體完全遮擋在地面形成的陰影稱為全影(Cast Shadow);由于光源大小差異在全影以外形成的陰影稱為半影(Penumbra);物體表面因光源變化而導(dǎo)致光的強(qiáng)弱變化,未被遮擋部分稱為陰影(Shading),而被遮擋部分稱為附著陰影(Attached Shadow)。另外,如果把陰影的類型作為課堂習(xí)題,學(xué)生回答不上來(lái)拿不到滿分的時(shí)候,說(shuō)不定還會(huì)增加一個(gè)心理陰影。 陰影對(duì)人的認(rèn)知、人工智能的發(fā)展有著不可忽視的影響,利弊共存。 首先,人對(duì)陰影的認(rèn)知,并非與生俱來(lái)的。1到2歲的小孩發(fā)現(xiàn)腳下連著個(gè)影子時(shí),并不會(huì)馬上明白這只是光學(xué)現(xiàn)象,反而可能會(huì)因?yàn)樗Σ坏舳a(chǎn)生短暫的恐懼感。成語(yǔ)中的“杯弓蛇影”也反映了影子對(duì)心理認(rèn)知的影響。那么,未來(lái)的機(jī)器人能賦予這種“心理陰影”的認(rèn)知能力嗎? 其次,陰影的存在為人類識(shí)別目標(biāo)的大小、遠(yuǎn)近、運(yùn)動(dòng)方向和數(shù)量等提供了參考,好的、壞的都有。它對(duì)許多人工智能的實(shí)際應(yīng)用也造成了不小的障礙。 舉例來(lái)說(shuō),今年3月的首例無(wú)人駕駛車撞人致死事件就與之有一定關(guān)系,如圖4所示。從美國(guó)優(yōu)步(Uber)公司公開(kāi)的事故報(bào)告來(lái)看,當(dāng)時(shí)優(yōu)步無(wú)人車上的駕駛員把激光雷達(dá)測(cè)距儀關(guān)掉了,結(jié)果使得無(wú)人駕駛只能僅依賴攝像頭獲取的圖像來(lái)實(shí)現(xiàn)自主駕駛。由于夜幕對(duì)駕駛周邊環(huán)境形成的巨大陰影,推車的受害者在出現(xiàn)前被完全掩蔽在黑暗中。分析的結(jié)果表明,雖然視頻中人被檢測(cè)出來(lái)了,但低于閾值。不過(guò),報(bào)告沒(méi)有提及在陰影中人是否被檢測(cè)出了。這些多少說(shuō)明,陰影的存在,使得智能駕駛系統(tǒng)在判斷目標(biāo)是否為人時(shí)的確定性顯著降低了。 由于確定性的降低,在等被害者從陰影中走出后,系統(tǒng)沒(méi)能輸出緊急剎車的指令,最終導(dǎo)致了慘劇的發(fā)生。這次事故也直接影響到了整個(gè)無(wú)人智能駕駛行業(yè)的研究。 圖4: 優(yōu)步無(wú)人駕駛事故中的4幀圖片 陰影對(duì)目標(biāo)的跟蹤和計(jì)數(shù)的干擾也很嚴(yán)重。如圖5(a)中,如果不能將車輛和其陰影分離,智能駕駛就無(wú)法精確定位車輛、車形和測(cè)距[2]。再如圖5(b)的計(jì)數(shù)問(wèn)題,如果缺乏好的陰影抑制或去除算法,則會(huì)影響對(duì)羊群的準(zhǔn)確計(jì)數(shù),進(jìn)而可能影響某些人或智能機(jī)器人的“睡眠”。 圖5 (a) 未進(jìn)行陰影抑制的車輛檢測(cè)[2]; (b) 陰影與羊群計(jì)數(shù) 但是,目前的陰影分離和去除仍沒(méi)有特別好的人工智能和計(jì)算機(jī)視覺(jué)算法[3]。有學(xué)者將陰影和實(shí)際圖像看成是兩個(gè)獨(dú)立變量,利用獨(dú)立分量分析(Independent Component Analysis)的技術(shù)來(lái)過(guò)濾和分離陰影。也有學(xué)者希望借顏色恒常知覺(jué)(Retinex)來(lái)設(shè)計(jì)算法去除陰影[4,5]。最近的深度學(xué)習(xí)技術(shù),有考慮采用深度卷積網(wǎng)的[6],也可以考慮采用“圖像+編輯”的思路、通過(guò)生成式對(duì)抗網(wǎng)絡(luò)或自編碼網(wǎng)絡(luò)來(lái)去除陰影。然而,由于陰影的多樣性,要構(gòu)造陰影去除的終極算法并不容易。更何況,這項(xiàng)研究在人工智能和計(jì)算機(jī)視覺(jué)領(lǐng)域本就屬于小眾研究。 另外,去除陰影也并非都是好的,因?yàn)殛幱皶?huì)幫助人們形成立體視覺(jué),以及對(duì)觀測(cè)目標(biāo)距離的正確判斷。在這種情況下,過(guò)濾或消除陰影可能導(dǎo)致危險(xiǎn)的后果,尤其在智能駕駛中。比如圖6中,陰影的位置可以讓人對(duì)目標(biāo)的空間位置產(chǎn)生明顯不同的判斷。如果沒(méi)有陰影,就很難猜測(cè)紙到底是W形狀還是M形狀了[1]。 圖6 筆的陰影對(duì)折紙結(jié)構(gòu)的幫助 [1] 值得指出的是,陰影如此有用,可將全部陰影類型均用于繪畫(huà)藝術(shù)的卻并不多。在繪畫(huà)中,用得最廣泛的是材料本身形成的陰影。而能反映物體運(yùn)動(dòng)和時(shí)間變化的全影(Cast shadow)則較少被使用。Jacobson和Werner曾分析了大量古代的繪畫(huà)作品,發(fā)現(xiàn)有兩幅表現(xiàn)這些變化的作品[7]。一幅是作者Giorgio de Chirico畫(huà)的“正午的教堂”。作者用長(zhǎng)長(zhǎng)的陰影配合明亮、正午的天空來(lái)形成永恒 (timelessness)的感覺(jué)。一幅是作者M(jìn)asaceio畫(huà)的“耶酥門徒猶大的故事”。他將猶大走路時(shí)形成的陰影畫(huà)成透明的,通過(guò)覆蓋在路邊信徒的身上來(lái)表達(dá)圣經(jīng)中曾經(jīng)描述過(guò)的神跡:猶大經(jīng)過(guò)的地方,路邊虔誠(chéng)信徒的頑疾會(huì)不治而愈。 圖7 正午的教堂(左) 和猶大用影子治愈信徒的故事(右)[7] 盡管全影能提供目標(biāo)的運(yùn)動(dòng)信息,Jacobson和Werner認(rèn)為這一信息很難在繪圖中被表現(xiàn)出來(lái),因而全影在繪畫(huà)中是可有可無(wú)的(expendable)[7]。 類似地,在人工智能和計(jì)算機(jī)視覺(jué)領(lǐng)域,基于靜態(tài)陰影的研究相對(duì)多些,但基于陰影的變化來(lái)估計(jì)目標(biāo)的距離、形狀、運(yùn)動(dòng)速度等的文章則少了很多??紤]到他能提供的豐富輔助信息,相信未來(lái)會(huì)有更多的學(xué)者會(huì)把動(dòng)態(tài)陰影的分析加入到人工智能的研究中。 人工智能戰(zhàn)爭(zhēng)下的仿生與陰影 陰影對(duì)自然界的生物也很重要。以昆蟲(chóng)為例,昆蟲(chóng)的背殼往往比其腹部要黑得多。當(dāng)其停在某處時(shí),暗的背殼靠近光, 形成的陰影可以有效的掩蓋其腹部體征。按格式塔統(tǒng)一論,昆蟲(chóng)就變成一個(gè)整體,其立體感消失,變得完全不像一個(gè)固體的、三維的“東西”, 從而達(dá)到偽裝的效果 [8]。 這一特性實(shí)際上也可以為軍事領(lǐng)域的間諜和竊聽(tīng)昆蟲(chóng)所利用。尤其在不久的將來(lái),隨著人工智能研究的快速發(fā)展,未來(lái)仿生機(jī)器人的體積將會(huì)更加微型化時(shí)。 那么,要發(fā)現(xiàn)這類仿生機(jī)器人,一個(gè)直接的辦法就是設(shè)法還原甚至放大其原有的立體感。一個(gè)最簡(jiǎn)單的辦法就是利用光線來(lái)主動(dòng)重建陰影。本人常受蚊蟲(chóng)困擾,不堪之余就會(huì)用強(qiáng)光手電筒來(lái)尋找隱藏在床角、椅凳下的蚊子,屢試不爽。原因也簡(jiǎn)單,強(qiáng)光能破壞蚊子的“陰影”,還原其立體結(jié)構(gòu),甚至可以放大蚊子的尺寸。成功消滅蚊子的時(shí)候,偶爾也會(huì)想想,如果能將其重建陰影的過(guò)程自動(dòng)化,說(shuō)不定就能用于未來(lái)人工智能戰(zhàn)爭(zhēng)下的反竊聽(tīng)。這種方法的好處是不用增加昂貴且復(fù)雜的設(shè)備、簡(jiǎn)單易行,隨后的微小目標(biāo)識(shí)別只需用常規(guī)的目標(biāo)檢測(cè)技術(shù)即可實(shí)現(xiàn)。 不難看出,陰影對(duì)人類的認(rèn)知和人工智能都有著很重要的作用,但要利用好它卻并非易事。除了陰影外,還有什么簡(jiǎn)單因素,也會(huì)讓愛(ài)犯錯(cuò)的智能體繼續(xù)犯錯(cuò)呢? 張軍平 2018年8月14日 參考文獻(xiàn): 1. P. Mamassian, D. C. Knill and D. Kersten. The perception of cast shadows. Trends in Cognitive Sciences, vol. 2, no. 8, 287-295, 1998. 2. A. Prati, I. Mikic, C. Grana and M. M. Trivedi. Shadow Detection Algorithms for Traffic Flow Analysis: A Comparative Study. in Proc. 4th IEEE Int. Conf. Intelligent Transportation Systems, Oakland, CA, Aug. 2001. 3. A. Sanin, C. Sanderson and B. C. Lovell. Shadow detection: A survey and comparative evaluation of recent methods. Pattern Recognition, vol. 45, issue 4, pages 1684-1695, 2012. 4. G. D. Finlayson, S. D. Hordley, and M.S. Drew. Removing shadows from images using Retinex. IS& TISID Tenth Color Image Conference. 2002. 5. E. H. Land. The Retinex theory of color vision. Scientific American, pages, 108-129, 1977. 6. S. H. Khan, M. Bennamoun, F. Sohel, and R. Togneri. Automatic shadow detection and removal from a single image. IEEE TPAMI, vol. 38, no. 3, 431-456, 2016. 7. J. Jacobson, and S. Werner. Why cast shadows are expendable: Insensitivity of human observers and the inherent ambiguity of cast shadows in pictorial art. Perception, vol. 33, pages. 1369-1383, 2004. 8. R. R. Behrens. On Max Wertheimer and Pablo Picasso: Gestalt Theory, Cubism and Camouflage. Gestalt Theory: Journal of the GTA, vol. 20, no. 2, 109-118, 1998. 文章來(lái)源:張軍平 |
|
|
來(lái)自: 親斤彳正禾呈 > 《科創(chuàng)》