| 文/陳根 當打開Netflix的時候,它會不會給你推薦一些劇,“恰好”是你感興趣的;當在Facebook上聊天時,它會不會給你推薦一些朋友,“恰好”是你欣賞的;當逛亞馬遜的時候,會不會推薦一些物品,“恰好”是你需要的。 其實并沒有那么多“恰好”,這些推薦都是平臺基于機器學(xué)習(xí)算法整合出的數(shù)據(jù)。而且,最新的研究顯示,這些平臺的算法已經(jīng)強大到可以幫助研究癌癥和阿爾茨海默氏癥等神經(jīng)退行性疾病的生物學(xué)語言。  
 蛋白質(zhì)是大而復(fù)雜的分子,它們在細胞內(nèi)發(fā)揮著重要作用,是構(gòu)成人體組織和調(diào)節(jié)器官功能的必需,比如抗體就是一種蛋白質(zhì),其功能是保護身體。 在影響全球5000萬人的阿爾茨海默病中,蛋白質(zhì)會變質(zhì),形成團塊,殺死健康的神經(jīng)細胞。健康的大腦有一個質(zhì)量控制系統(tǒng),可以有效地處理這些潛在危險的大量蛋白質(zhì),即所謂的聚合體。 但是一些無序的蛋白質(zhì)形成液體狀的蛋白液滴,它們沒有膜,相互之間自由融合。蛋白質(zhì)凝結(jié)物控制著細胞中的關(guān)鍵事件,如基因表達,任何與這些蛋白滴相關(guān)的缺陷結(jié)合都可能導(dǎo)致癌癥等疾病的發(fā)生,而疾病的大腦無法控制這些結(jié)合。 為此,研究人員使用類似的平臺機器學(xué)習(xí)技術(shù)訓(xùn)練了一個大規(guī)模的語言模型,以觀察體內(nèi)蛋白質(zhì)出現(xiàn)問題時會發(fā)生什么。 研究人員特別要求該程序?qū)W習(xí)形變生物分子凝結(jié)物的語言,即在細胞中發(fā)現(xiàn)的蛋白質(zhì)液滴,因為只有真正了解了這些語言,才能破解導(dǎo)致癌癥和阿爾茨海默氏癥等神經(jīng)退行性疾病的生物功能障礙密碼。 科學(xué)家向算法提供了已知蛋白質(zhì)的所有數(shù)據(jù),結(jié)果發(fā)現(xiàn),這些平臺的機器學(xué)習(xí)技術(shù)可以解讀癌癥、阿爾茨海默氏癥和其他神經(jīng)退行性疾病的生物語言。可以說,將機器學(xué)習(xí)技術(shù)引入到神經(jīng)退行性疾病和癌癥的研究中,絕對是一個游戲規(guī)則的改變。 這一發(fā)現(xiàn)將有助于糾正細胞內(nèi)部導(dǎo)致疾病的語法錯誤,以及幫助相關(guān)靶向藥物的開發(fā),以極大地緩解癥狀或根本防止癡呆癥的發(fā)生。該突破性研究已于2021年4月8日發(fā)表在科學(xué)雜志《PNAS》上。 | 
|  |