|
來源:中山大學(xué) 2023-05-03 13:37 目前生物界中已經(jīng)有超過150多種的RNA修飾堿基被報道,其中N6-甲基腺嘌呤(m6A)在脊椎動物中含量最為豐富,也是被研究得最為透徹的一種修飾堿基。目前檢測m6A主要是基于二代測序的方法 目前生物界中已經(jīng)有超過150多種的RNA修飾堿基被報道,其中N6-甲基腺嘌呤(m6A)在脊椎動物中含量最為豐富,也是被研究得最為透徹的一種修飾堿基。目前檢測m6A主要是基于二代測序的方法,這些方法存在假陽性、操作復(fù)雜以及僅限于位點檢測等問題。于是納米孔測序技術(shù)(Oxford Nanopore Technologies,ONT)成為了一種理想的取代方法。ONT測序平臺根據(jù)監(jiān)測單個分子在合成聚合物膜嵌入的納米孔中穿過時引起的電流變化直接測序DNA或RNA,修飾堿基穿孔產(chǎn)生的電流可能與對應(yīng)的經(jīng)典堿基有所不同,因此可以根據(jù)檢測到的電流差異來檢測包括m6A在內(nèi)的修飾堿基。自那時起,已經(jīng)有十余種計算工具被開發(fā)出來(圖1),用于從直接RNA測序(Direct RNA Sequencing,DRS)中鑒定m6A的位置以及確定其化學(xué)計量。
圖1 利用ONT DRS平臺實現(xiàn)m6A檢測的工具、流程以及分類
盡管已開發(fā)出許多高度復(fù)雜、先進(jìn)的計算工具來檢測和量化m6A,但目前仍缺乏對這些工具進(jìn)行徹底評估和比較的研究。為填補(bǔ)這一空白,中山大學(xué)生命科學(xué)學(xué)院駱觀正教授課題組展開相關(guān)研究。 本研究利用多物種多重復(fù)(小鼠胚胎細(xì)胞和擬南芥各兩個重復(fù))樣本為評估數(shù)據(jù),以多種驗證集對這些工具進(jìn)行了全面評估(圖2),包括使用兩個連續(xù)評估指標(biāo)(接受者操作特征(Receiver Operating Characteristic,ROC)和精確度-召回率(Precision Recall,PR)曲線)對它們的性能進(jìn)行了定量評估,比較了它們檢測出的top位點的精確度,以及它們在最優(yōu)閾值下檢測出的位點的準(zhǔn)確度,召回率以及F1得分。結(jié)果發(fā)現(xiàn)大多數(shù)工具在精確度和召回率之間存在權(quán)衡
圖2 檢測m6A的ONT工具能力的性能評價
除此之外,本研究還評估了這些工具在檢測過程中的內(nèi)在偏差,并證明引入負(fù)對照樣本可以提高大多數(shù)工具的性能。此外,還發(fā)現(xiàn)檢測能力在不同的motif之間存在差異,這是因為在某些序列上,電流差異不容易被檢測到。對于可以對m6A進(jìn)行定量的工具,在它們的計量估計中觀察到了廣泛的差異,即使在某些motif中可以獲得可接受的結(jié)果。測序深度和修飾的化學(xué)計量也是另外兩個重要的影響因素。
綜上所述,研究為目前用于基于ONT DRS數(shù)據(jù)檢測m6A的計算工具提供了深入的見解,并強(qiáng)調(diào)了進(jìn)一步改進(jìn)這些工具的潛力,這些可能會成為未來研究的基礎(chǔ)。以上研究成果以“Systematic comparison of tools used for m6A mapping from nanopore direct RNA sequencing”為題,于2023年4月5日在Nature Communications雜志發(fā)表。中山大學(xué)生命科學(xué)學(xué)院研究生鐘振東和謝應(yīng)源為文章的共同第一作者,駱觀正教授和張璋副教授為通訊作者。中山大學(xué)生命科學(xué)學(xué)院為第一作者單位。本工作受到科技部重點研發(fā)項目、國家自然科學(xué)基金及深圳灣學(xué)者項目的資助。 |
|
|