|
剛從國家天文臺的老同學(xué)處聽來一個小道消息,說他們跟騰訊合作,使用騰訊的人工智能算法和GPU算力,提升了在FAST望遠鏡(中國天眼)數(shù)據(jù)中搜尋脈沖星的效率,并且已經(jīng)藉此發(fā)現(xiàn)了新的脈沖星。 騰訊使用的具體方法目前還沒有公布,具體發(fā)現(xiàn)的是什么樣的脈沖星也要等論文發(fā)了才知道,不過這不妨礙我們根據(jù)已經(jīng)歷年來已經(jīng)公開的材料,做一番猜測。 在此之前,我會先簡單回顧脈沖星研究的意義,以及簡單介紹脈沖星的搜索方法。如果對這些背景已經(jīng)有所了解,就可以直接跳到第三部分,看看人工智能是如何應(yīng)用在脈沖星搜索中的。 脈沖星研究的意義脈沖星是1967年,當(dāng)時正在劍橋大學(xué)讀研究生的約瑟琳·貝爾女士發(fā)現(xiàn)的。雖然已經(jīng)過去了50多年,脈沖星仍然是一個不斷給人驚喜的研究領(lǐng)域。 它一被發(fā)現(xiàn),首先就證實了一個遙遠的猜測:1934年,巴德和茲維基在中子剛剛發(fā)現(xiàn)兩年之際,提出可能存在一種完全由中子構(gòu)成的天體——中子星。 而發(fā)出極短周期(通常小于1秒)脈沖的這種新天體,提示我們它就是「中子星」這種此前僅僅是猜想的致密物體。 中子星的質(zhì)量比太陽還重,而直徑只有十幾公里。相當(dāng)于在北京三環(huán)以內(nèi)集中了幾十萬個地球質(zhì)量。于是一個首當(dāng)其沖的問題就是,這么致密的物質(zhì)組成的天體,其上物質(zhì)的狀態(tài)和性質(zhì)是怎樣的? 這個問題的答案就藏在脈沖星的“心電圖”中。長期監(jiān)測我們會發(fā)現(xiàn),隨著轉(zhuǎn)動能量的消耗,脈沖星的自轉(zhuǎn)周期逐漸減慢。但是偶爾,它的自轉(zhuǎn)會突然有一個小幅加速(“glitch”)——這種脈沖星“心率”的突變,應(yīng)當(dāng)起源于脈沖星地質(zhì)結(jié)構(gòu)的突變,也就是脈沖星上的“地震”。 就像地球物理學(xué)家可以通過地震波的傳播摸清地球核、幔、殼的結(jié)構(gòu),天文學(xué)家也可以通過監(jiān)測脈沖星上的地震,研究極端致密物態(tài)組成的中子星的結(jié)構(gòu)。 除了glitch的時候以外,脈沖星的周期非常穩(wěn)定,堪比原子鐘。于是脈沖星研究的另一個用途,是利用這種宇宙中天然存在的精密時鐘,對廣義相對論進行驗證。 天文學(xué)家對一對兒在1974年發(fā)現(xiàn)的毫秒脈沖星進行長期監(jiān)測,發(fā)現(xiàn)其相互繞轉(zhuǎn)周期加速的趨勢,完全符合廣義相對論的預(yù)言——它們之間不斷相互接近,正是由于兩個致密天體繞轉(zhuǎn)時攪動時空,發(fā)出引力波,不斷帶走轉(zhuǎn)動能量。這是人類第一次獲得引力波存在的間接證據(jù)。 將來,脈沖星還將以另一種方式為引力波研究做出貢獻:當(dāng)宇宙中某個地方發(fā)生雙黑洞并合之類的引力波事件,引力波如海嘯般向外擴散、掃過若干脈沖星,我們原則上可以通過監(jiān)測這些脈沖星的周期變化,探知這次引力波事件的存在——這一方法,叫做“脈沖星計時陣列”。 脈沖星陣列還有另一個用途:在未來的星際旅行中,脈沖星可以充當(dāng)“星際GPS”,為星際飛船提供導(dǎo)航所需的參考信號。 脈沖星的搜索方法脈沖星用處很多,但總要先找到它們,才談得上如何利用。 對于早期發(fā)現(xiàn)的那些亮脈沖星,它們輻射強度的周期性變化,用肉眼就能直接看出: 但對于大部分脈沖星而言,單個脈沖的強度很弱,幾乎完全埋沒在噪聲中,只有通過按照周期折疊,讓噪聲彼此抵消,才能增強信噪比,把脈沖形狀“露出來”。 但是問題來了,對于尚未發(fā)現(xiàn)的脈沖星,怎么知道它周期是多少、又該按什么周期折疊呢? 有一個辦法,就是傅立葉變換。通過變換,可以計算出數(shù)據(jù)有哪些周期性信號。 對于射電天文觀測,還有另外一個復(fù)雜性。脈沖星跟我們之間,可能充斥著非常復(fù)雜的電離態(tài)星云。 脈沖星的信號經(jīng)過這些星云時,會跟其中的自由電子發(fā)生相互作用。不同頻段的信號受到的影響不同:比較低頻的,會受到比較強的“阻滯”,晚一些到達觀測者;比較高頻的,會早一些到達觀測者。 就像光通過棱鏡時,由于不同顏色的光在玻璃中光速不同、折射率不同,會產(chǎn)生的色散現(xiàn)象一樣,電磁波通過星際介質(zhì)時的這種效應(yīng),也被稱作“色散”。 對于未知的脈沖星,我們是無法預(yù)知其色散的。我們只能大致估計出銀河系內(nèi)脈沖星的色散的數(shù)值范圍,然后在這個范圍內(nèi)以一定間隔取值,對數(shù)據(jù)進行“盲”消色散。盲消色散之后的結(jié)果,才能進行傅立葉變換及按周期折疊。 顯然,在取值范圍內(nèi)眾多可能的色散中,正確的那個色散可以給出最好的信噪比;而越離譜的盲猜值,信噪比就越差: ![]() 使用脈沖星搜尋程序PRESTO,我們可以對脈沖星巡天的原始數(shù)據(jù)進行盲消色散和折疊處理,得到一系列(大量)這樣的脈沖星候選體分析圖表: ![]() 原則上觀察這樣的脈沖星候選體分析圖表,天文學(xué)家就可以判斷出一組信號是否來自脈沖星;以及如果是脈沖星的話,它的周期、色散量等各項參數(shù)是多少。 人工智能在脈沖星搜索中的應(yīng)用下面問題來了。PRESTO產(chǎn)生了一大堆這樣的圖,天文學(xué)家就算再熟練,一秒看一張,也看不過來呀! 畢竟脈沖星巡天是FAST望遠鏡的重要任務(wù)之一,而FAST每天可以產(chǎn)生500TB的數(shù)據(jù),算下來每周都會產(chǎn)生三千萬張脈沖星候選體的分析圖表。 你想想如果你導(dǎo)師讓你這個小博士生一周看三千萬張圖,100個你不吃不喝啥也不干也看不過來呀。 咋辦呢?笨辦法,雇一幫熱愛科學(xué)的高中生代勞,美名其曰公眾科學(xué): ![]() 美國 Pulsar Search Collaboratory 項目就是這么干的。 這樣做不是不行,順便搞搞中學(xué)生天文教育也是好事。但人一多,標準就不好把控。而且人眼的特征識別能力雖然強,對于特別弱的信號,仍然會有遺漏和誤判。 于是天文學(xué)家開始求助于人工智能。 大而化之,人工智能在脈沖星搜索中的應(yīng)用又分兩種[1]: 一種,是天文學(xué)家先用PRESTO等軟件把脈沖星候選體的特征數(shù)據(jù)提取好,諸如周期、色散量、信噪比,再如脈沖在整個周期中占的比例(占空比)、脈沖的數(shù)量和形狀、是否由于身處雙星系統(tǒng)而有周期性多普勒效應(yīng),等等。 接下來,把這些參數(shù)組合喂給神經(jīng)網(wǎng)絡(luò):給機器提供一些已知脈沖星的參數(shù)進行深度學(xué)習(xí),然后用訓(xùn)練好的模型去分析海量未知數(shù)據(jù)。 由于前一種方法中,提取參數(shù)這一步可能引入誤差,還有一種更“懶惰”而有效的方法:直接把PRESTO產(chǎn)生的那幾張圖(前一節(jié)末圖中幾個紅框標記的)喂給AI,讓AI自己進行畫面特征提取。 這次跟國家天文臺中國天眼團隊合作的是騰訊優(yōu)圖實驗室,這是一個聚焦計算機視覺、專注圖像處理的團隊,因此我有理由相信,他們采用的是后一種方案。 另外據(jù)本人獨家采訪參與該工作的研究人員,騰訊云還提供了強大的GPU算力,有效加速了消色散和折疊過程。面對FAST的海量數(shù)據(jù),強大的算力顯然也是天文學(xué)家必不可少的重要工具。 在騰訊的AI算法和GPU算力加持下,3000萬張圖,只需要3天時間就可以分析完成,確保了FAST脈沖星巡天數(shù)據(jù)可以得到及時有效的處理。 有這樣的工業(yè)界先進技術(shù)加持,天文學(xué)家再也不怕數(shù)據(jù)處理不完啦。 ![]() 參考
|
|
|