| 本文轉(zhuǎn)自iMeta公眾號。  人類體內(nèi)有各種各樣的微生物,但這些微生物群的基因序列是否可以用來識別癌癥,這是一個重大的爭議。——ROGER HARRIS/科學來源 幾年前,當科學家們在Nature雜志上報道不同類型的癌癥始終與不同的微生物群落有關(guān)時,臨床的可能性令人振奮。這篇2020年的論文(https://www./articles/s41586-020-2095-1)(圖1)使用一種人工智能形式來梳理出指示特定癌癥的微生物DNA,并提出了“一類基于微生物組的新型癌癥診斷工具”。從那以后,這項研究獲得了數(shù)百次引用,為其他10多項研究提供了數(shù)據(jù),并幫助證明了至少一個商業(yè)項目的合理性,該項目旨在利用人體血液中的微生物序列來發(fā)現(xiàn)癌癥的存在。  圖1 但這項研究結(jié)果現(xiàn)在正受到審查,因為一個研究團隊聲稱發(fā)現(xiàn)了“重大數(shù)據(jù)分析錯誤”(https://www./content/10.1101/2023.07.28.550993v1)(圖2),這些錯誤破壞了論文的結(jié)論。根據(jù)評論者本周在預印本服務器bioRxiv上發(fā)布的一份手稿,Nature雜志的作者未能正確地從測序的癌癥組織數(shù)據(jù)庫中過濾出人類DNA。這導致數(shù)以百萬計的人類基因序列被錯誤地歸類為微生物——這也許可以解釋為什么這項研究發(fā)現(xiàn)了不可能的微生物,比如與膀胱癌有關(guān)的海藻細菌。  圖2 預印本還認為,與該團隊的分析有關(guān)的一個單獨的計算錯誤無意中產(chǎn)生了沒有任何癌癥特異性模式。預印本的作者之一,約翰霍普金斯大學的計算生物學家Steven Salzberg表示,這篇論文的“主要結(jié)論是完全錯誤的”。 加州大學圣地亞哥分校的微生物學家、Nature雜志論文的資深作者Rob Knight駁斥了這些批評,并指出他的實驗室已經(jīng)在對同一批科學家早些時候發(fā)表的預印本(https://www./content/10.1101/2023.01.16.523562v1)(圖3)的回應(https://www./content/10.1101/2023.02.10.528049v1)(圖4)中反駁了這些批評。  圖3  圖4 Knight表示,“這種新的預印本是完全公開討論過的?!?Knight于2019年共同創(chuàng)立了Micronoma公司,開發(fā)基于微生物組的癌癥診斷方法。他還強調(diào)了他的團隊2022年在Cell雜志上發(fā)表的論文(https://www./cell/fulltext/S0092-8674(22)01127-8)(圖5),該論文使用了更新的方法來分析腫瘤中的真菌和細菌,并得出了與Nature雜志上的那篇論文相似的結(jié)論。  圖5 但旁觀的研究人員表示,新的預印本遠遠超出了之前的指控,其論點令人信服。劍橋大學的細菌遺傳學家Julian Parkhill表示,“這是對原始手稿中出現(xiàn)錯誤地方的深入剖析。” 多位研究人員告訴Science雜志,微生物科學無疑具有生物醫(yī)學的前景,其他研究小組已經(jīng)將微生物與特定的癌癥聯(lián)系起來。但是,諾丁漢特倫特大學的微生物學家和生物信息學家Lesley Hoyles表示,這場辯論為嚴重依賴計算方法的微生物組研究提供了一個警示。她指出,“人們對即將出現(xiàn)的內(nèi)容缺乏批評,我們需要有人做這類分析?!?/p> 細菌出現(xiàn)在意想不到的地方 Nature雜志的這篇論文使用了一個名為“癌癥基因組圖譜”(TCGA)的數(shù)據(jù)庫,該數(shù)據(jù)庫存儲了來自人類癌癥樣本的大量DNA序列。數(shù)據(jù)庫根據(jù)序列是否與所謂的人類參考基因組相匹配,將序列分類為人類或非人類——盡管這種分類已知是不完善的。 Nature雜志的研究作者將TCGA的“非人類”序列,以及來自幾十名無癌癥患者和100名癌癥患者的序列,與細菌、病毒和其他微生物的DNA數(shù)據(jù)庫進行了比較。結(jié)果表明,不同類型的癌癥有一個特定的常駐微生物群落。將數(shù)據(jù)輸入到機器學習算法中,研究人員可以僅從樣本的微生物組成中可靠地預測癌癥類型或癌癥是否存在,有時準確率接近100%。研究人員建議,這些相關(guān)性可以用來設計從一個人的血液樣本中檢測癌癥的測試。(其他許多研究小組正在開發(fā)癌癥的血液檢測方法,可以提取腫瘤脫落的人類DNA或蛋白質(zhì)https://www./content/article/complexities-are-staggering-u-s-plans-huge-trial-blood-tests-multiple-cancers)(圖6)。Knight的團隊在一個公共網(wǎng)站(http://cancermicrobiome./CancerMicrobiome_DataBrowser/)(圖7)上分享了詳細的結(jié)果。  圖6  圖7 但一些讀者注意到了一些令人困惑的發(fā)現(xiàn)。雖然這項工作在癌組織中發(fā)現(xiàn)了許多人類細菌,但除了神秘的海藻細菌外,還有一種與前列腺癌有關(guān)的海洋熱液噴口細菌(a marine hydrothermal vent bacterium),以及一種與黑色素瘤有關(guān)的珊瑚細菌。在1月份的預印本中,東安格利亞大學的研究人員表示,這可能表明該研究的方法存在問題(https://www./content/10.1101/2023.01.16.523562v1)(圖8)。他們特別指出,癌癥組織中意想不到的微生物的存在可能是數(shù)據(jù)庫錯誤的結(jié)果,其中一個物種的序列被錯誤地標記為另一個物種的序列。  圖8 Parkhill解釋道,人類DNA不小心進入微生物數(shù)據(jù)庫是很常見的,在那里它被錯誤地列在微生物物種名稱下。這意味著,除非研究人員在將其與微生物數(shù)據(jù)庫進行比較之前,適當?shù)貜娜梭w組織測序數(shù)據(jù)中過濾掉人類DNA,否則他們有可能檢測到并不真正存在于組織中的生物體。這是Nature雜志研究中提出的第一個預印本。 在一篇27頁的回應中,Knight和他的同事們對這些觀察的重要性提出了質(zhì)疑(https://www./content/10.1101/2023.02.10.528049v1)(圖9),他們補充道,他們在Cell雜志上發(fā)表的論文使用了更新的方法,復制了Nature雜志上的結(jié)論。但Salzberg并不相信這個回答,他開發(fā)了Nature雜志論文中使用的一些計算工具。  圖9 Salzberg與東安格利亞大學的研究人員(他們自己也申請了使用細菌作為前列腺癌生物標志物的專利)合作,下載并重新分析了Nature雜志研究的部分數(shù)據(jù)。Salzberg表示,當他們?yōu)槿祟怐NA加入額外的過濾器時,他們的分析發(fā)現(xiàn),Nature雜志的作者們認為是微生物的數(shù)百萬序列實際上是人類的。新的預印本認為,研究中發(fā)現(xiàn)的許多微生物根本不在TCGA的癌癥樣本中。 Knight表示,在特定癌癥中發(fā)現(xiàn)的序列的確切身份不會改變他團隊的結(jié)論。出于診斷目的,“如果你試圖做的是區(qū)分……癌癥病例與對照,或者一種癌癥與另一種癌癥,那么這些區(qū)分序列的存在比你叫它們什么更重要。”分析“可以通過連續(xù)的技術(shù)和數(shù)據(jù)來源進行改進”,并指出其他研究,即他和他的同事本周進行的一項小型分析(https://github.com/gregpoore/tcga_rebuttal/tree/master)(圖10)表明,即使在更嚴格地排除了人類序列的情況下,微生物的差異仍然存在。  圖10 有爭議的模式 Salzberg及其同事的新預印本還提到了Nature雜志論文中基于樣本微生物群的計算機模型預測癌癥類型的令人印象深刻的能力。由于組織樣本來自多個不同的醫(yī)療中心和時間,Knight和同事使用了一種稱為歸一化的技術(shù)來試圖消除一些可變性。但新的預印本稱,這一過程存在問題:它為每種癌癥類型的數(shù)據(jù)引入了不同的電子標簽。這意味著,當研究小組將規(guī)范化數(shù)據(jù)輸入他們的算法時,計算機可以秘密地使用標簽,而不是微生物數(shù)據(jù),來確定樣本來自哪種癌癥類型。 Knight表示,他的團隊不同意預印本的分析,并再次強調(diào),Cell雜志的論文得出了同樣的結(jié)論,盡管它沒有以同樣的方式處理數(shù)據(jù)。他補充道,他的團隊并沒有“特別有動力”去梳理預印本的冗長分析,也沒有在社交媒體上發(fā)表評論,因為它已經(jīng)在社交媒體上引起了轟動?!叭绻麄冊谕性u議的期刊上發(fā)表這篇文章,我們會解決這個問題,……我認為這是研究科學的合適方式,就像過去幾個世紀一樣?!?/p> 在一份聲明中,Micronoma公司首席執(zhí)行官Sandrine Miller-Montgomery指出,該公司正在開發(fā)的產(chǎn)品并不依賴于Nature雜志的論文。她表示,“我們開發(fā)了額外的人體過濾和質(zhì)量控制方法,將人類基因組DNA污染降到最低,發(fā)現(xiàn)這樣做并不妨礙診斷癌癥存在或類型的能力?!睂τ谄浞伟┭簷z測,“Micronoma已經(jīng)建立了一個獨立的、專有的微生物數(shù)據(jù)庫,該數(shù)據(jù)庫基于非人類基因組的元基因組組裝?!?/p> 其他使用Nature雜志數(shù)據(jù)的學術(shù)團隊的研究受到的影響尚不清楚。一些科學家表示,期刊應該對嚴重依賴計算方法的研究更加謹慎。萊頓大學的化學免疫學家Jacques Neefjes表示,有了足夠的數(shù)據(jù)點,“計算機總能找到相關(guān)性”,這使得在真實樣本中進行驗證變得尤為重要。雪松-西奈醫(yī)學中心的微生物組科學家Ivan Vujkovic-Cvijin補充表明,在如何在微生物組科學中使用機器學習方面缺乏標準?!拔艺J為這種科學分歧強調(diào)了開發(fā)它們的必要性?!?/p> 其他人則希望隨后的討論將有助于解決原論文中的任何問題。Parkhill表示,“作為科學家,我們應該接受挑戰(zhàn)。我們應該能夠客觀地處理它,并在必要時加以糾正。希望這將會發(fā)生?!?/p> 文章學術(shù)主角  Rob Knight rknight@ 加州大學圣地亞哥分校 微生物組創(chuàng)新中心主任。發(fā)表論文600多篇,被引超367309次,H-index 229。  ??Scholar.google主頁: https://scholar.google.com/citations?user=_e3QL94AAAAJ&hl=en&oi=ao  Steven Salzberg salzberg@jhu.edu 約翰霍普金斯大學生物醫(yī)學工程、計算機科學和生物統(tǒng)計學彭博杰出教授,計算生物學中心主任。發(fā)表論文177篇,被引超316760次,H-index 159。  ??Scholar.google主頁: https://scholar.google.com/citations?user=sUVeH-4AAAAJ&hl=en&oi=ao | 
|  | 
來自: 菌心說 > 《腸道菌群、微生態(tài)》