|
在過去20多年中,非編碼小RNA(small non-coding RNAs (sncRNA))的研究不斷地給學(xué)界帶來驚喜?,F(xiàn)有證據(jù)充分證明siRNA, miRNA, piRNA, 等經(jīng)典sncRNA在基因轉(zhuǎn)錄后調(diào)控以及多種疾病發(fā)生過程中起著重要的作用。然而,隨著測序技術(shù)和生物信息分析工具的進(jìn)步,近年來學(xué)界逐步認(rèn)識到在熟知的經(jīng)典小RNA之外還存在大量其它類型的新型sncRNA,例如近年來發(fā)現(xiàn)的tRNA-derived small RNA (tsRNA)、rRNA-derived small RNA (rsRNA)等。這些小RNA具有比經(jīng)典小RNA更古老的進(jìn)化起源,而且它們的生成(biogenesis)可以被多種RNA酶(RNase)和RNA修飾調(diào)控,另外它們在細(xì)胞的生理功能以及疾病發(fā)生中也發(fā)揮著重要的作用。目前對這些新型sncRNA及其RNA修飾的研究正在逐步打開探索非編碼小RNA宇宙的新紀(jì)元。 2022年4月12日, 加州大學(xué)河濱分校Junchao Shi、Qi Chen和內(nèi)華達(dá)大學(xué)雷諾醫(yī)學(xué)院Tong Zhou在Nature Cell Biology上以封面故事(圖1)發(fā)表題為 Exploring the expanding universe of small RNAs 的前沿綜述(Perspective)。文章介紹了近年來興起的對經(jīng)典小RNA以外的新型小RNA(例如tsRNA, rsRNA, ysRNA)的研究以及這些小RNA與siRNA/miRNA/piRNA在生成和作用機(jī)制上的差異;重點(diǎn)討論了近年來新的測序方法帶來的對小RNA類型在組織細(xì)胞中組成結(jié)構(gòu)的重新認(rèn)識,以及對小RNA測序數(shù)據(jù)進(jìn)行生物信息分析時的盲區(qū)/誤區(qū)。由于tsRNA/rsRNA等新型小RNA攜帶有大量RNA 修飾,文章著重討論了基于新型質(zhì)譜技術(shù)或納米孔技術(shù)對小RNA修飾進(jìn)行系統(tǒng)定量/定位的方法以及面臨的挑戰(zhàn),并指出針對這些小RNA修飾的研究是未來小RNA領(lǐng)域的一個新方向。
圖1:Nat Cell Biol 2022年4月候選封面:探索不斷擴(kuò)展的小RNA宇宙 非經(jīng)典小RNA在生成和作用機(jī)理上的主要特點(diǎn) 由于tsRNA, rsRNA, ysRNA等非經(jīng)典小RNA的產(chǎn)生主要來自于細(xì)胞內(nèi)其他含有高級結(jié)構(gòu)的較長RNA(例如tRNA, rRNA)的斷裂和代謝,因此很長時間以來這些小RNA被認(rèn)為僅僅是其RNA前體的降解產(chǎn)物而沒有受到太多重視。然而近年來越來越多的研究發(fā)現(xiàn),這些小RNA呈現(xiàn)明顯的組織細(xì)胞特異性,其生成和表達(dá)受到細(xì)胞環(huán)境和遺傳因素的精密調(diào)控,在許多生物過程中發(fā)揮重要作用(例如細(xì)胞應(yīng)激反應(yīng)、癌細(xì)胞轉(zhuǎn)移、干細(xì)胞分化、病毒復(fù)制、細(xì)胞間交流以及早期胚胎表觀遺傳調(diào)控等),并且還可以作為臨床上無創(chuàng)診斷的分子標(biāo)記物。 從演化的尺度上看,tsRNA, rsRNA等非經(jīng)典小RNA在生物界廣泛存在,橫跨細(xì)菌、古細(xì)菌以及真核生物。與siRNA/miRNA/piRNA相比,tsRNA/rsRNA在進(jìn)化起源、細(xì)胞內(nèi)豐度、生物發(fā)生和發(fā)揮功能的方式等方面具有一系列特征,這些特點(diǎn)也更新了我們對于sncRNA的傳統(tǒng)認(rèn)識。例如,tsRNA, rsRNA 在不含有siRNA、miRNA 和 piRNA的單細(xì)胞生物(比如細(xì)菌、古細(xì)菌和一些單細(xì)胞原生動物)中呈現(xiàn)出動態(tài)表達(dá)模式且能夠發(fā)揮功能。這表明tsRNA、rsRNA在進(jìn)化上出現(xiàn)的時間早于siRNA、miRNA 和 piRNA。這些現(xiàn)象也支持了一種觀點(diǎn),即最古老最原始的小RNA生成途徑是:通過降解/斷裂/切割較長的 RNA(例如,tRNA、rRNA、snRNA、snoRNA, yRNA和vtRNA)生成小RNA。 此外,tsRNA、rsRNA 等非經(jīng)典 sncRNA的生物發(fā)生涉及其前體RNA(tRNA、rRNAs)通過不同種類的RNase酶家族成員切割產(chǎn)生(例如,RNase P、RNase Z、RNase T2, RNase A) ,這些保守的RNase酶在進(jìn)化上出現(xiàn)得比負(fù)責(zé)siRNA/miRNA生成的Dicer酶(僅存在于真核生物中)更早,并且tsRNA/rsRNA的生成受到多種RNA修飾以及相關(guān)修飾酶的調(diào)控。 在行使功能方面,siRNA/miRNA/piRNA主要是通過與Argonaute(AGO)家族蛋白結(jié)合對目標(biāo)序列實(shí)現(xiàn)RNAi效應(yīng)(例如,參與轉(zhuǎn)錄后mRNA切割、降解、翻譯抑制,或轉(zhuǎn)錄沉默);而tsRNA/rsRNA等非經(jīng)典sncRNA可以獨(dú)立于AGO蛋白家族成員行使功能。針對這方面的研究尚處于起步階段,也有待未來進(jìn)一步探索。 此外,為了今后對非經(jīng)典小RNA命名統(tǒng)一,文章提出了一套標(biāo)準(zhǔn)命名規(guī)則如下:
【筆者按:本文提出統(tǒng)一小RNA命名的背景是因?yàn)槟壳皩W(xué)界對于非經(jīng)典小RNA的命名比較混亂。例如tsRNA在一些文獻(xiàn)中也被稱為tRNA-derived fragment (tRF),或tRNA‐derived stress‐induced RNA (tiRNA)。這些名稱具有各自的歷史沿革,比如tiRNA的命名是由于最初發(fā)現(xiàn)這些小RNA受細(xì)胞應(yīng)激誘導(dǎo)產(chǎn)生。然而后續(xù)研究發(fā)現(xiàn),在生理情況下tsRNA也大量存在,故而tiRNA這個名字不再具備普適性。而tRF則簡單地把這些RNA稱為tRNA的片段,名字本身會讓讀者產(chǎn)生這是一類'不太重要的RNA降解產(chǎn)物’的錯覺,不能很好地體現(xiàn)tsRNA是一類不同于miRNA等經(jīng)典小RNA的具有獨(dú)特功能的新型小RNA?!?/span> 新的測序方法—重新認(rèn)識組織細(xì)胞小RNA全景圖 盡管對各種新型非經(jīng)典小RNA功能和機(jī)理的認(rèn)識還處于起步階段,近年來的針對非經(jīng)典小RNA的系統(tǒng)發(fā)掘和測序技術(shù)已經(jīng)取得一系列重要進(jìn)展。研究認(rèn)識到,許多tsRNA/rsRNA具有與siRNA/miRNA/piRNA不同的末端和內(nèi)部修飾,這也導(dǎo)致了針對經(jīng)典小RNA的傳統(tǒng)測序方法無法對非經(jīng)典小RNA進(jìn)行有效地發(fā)掘(這也是過去對于tsRNA/rsRNA等小RNA關(guān)注不足的原因之一)。近年來隨著學(xué)界認(rèn)識到這個問題的嚴(yán)重性,對RNA修飾特性的研究催生了一系列新方法來克服這些RNA修飾帶來的測序問題,這些最新的測序方法也促使學(xué)界對小RNA在組織細(xì)胞中的表達(dá)圖譜有了全面的重新認(rèn)識。 例如,PANDORA-seq, CPA-seq等技術(shù)通過一系列酶學(xué)處理,解決了由于RNA末端修飾導(dǎo)致的接頭連接問題,以及RNA特定甲基化修飾妨礙逆轉(zhuǎn)錄過程的問題。和傳統(tǒng)小RNA測序結(jié)果相比,PANDORA-seq等方法的測序結(jié)果揭示了完全不同的小RNA全景圖(landscape)。例如,大多數(shù)哺乳動物組織細(xì)胞中,miRNA的占比要遠(yuǎn)低于tsRNA 和rsRNA的占比,并且在一些組織細(xì)胞(例如脾臟,胚胎干細(xì)胞,Hela細(xì)胞,成熟精子)中tsRNA/rsRNA的含量占絕對多數(shù)。 『編者按:miRNA在很多組織細(xì)胞中的占比很少這個發(fā)現(xiàn)為研究其它類型的sncRNA打開了一扇新的大門,定有大量新的寶藏等待未來被發(fā)掘(見BioArt報道:1.PANDORA-seq;2.CPA-seq )』 文章審視了小RNA的發(fā)掘史,認(rèn)為這是一個類似“盲人摸象”的故事。隨著技術(shù)和認(rèn)知的發(fā)展,可能還會有更多種類的小RNA被發(fā)掘。今后小RNA測序的改進(jìn)方向包括進(jìn)一步優(yōu)化接頭連接效率以及逆轉(zhuǎn)錄過程,減少建庫擴(kuò)增產(chǎn)生的偏差,以及在新技術(shù)的背景下實(shí)現(xiàn)微量/單細(xì)胞水平的小RNA建庫測序等。 小RNA數(shù)據(jù)分析及解讀中的誤區(qū)和解決方案 過去小RNA的生物信息工具主要針對miRNA、piRNA等某一特定種類的小RNA進(jìn)行分析。然而隨著測序技術(shù)的發(fā)展,研究發(fā)現(xiàn)同一樣本中往往同時存在不同種類小RNA(例如miRNA、tsRNA 和 rsRNA),這對于sncRNA的生物信息學(xué)分析提出了新的要求和挑戰(zhàn)(見BioArt報道:SPORTS1.0),特別是如何通過測序數(shù)據(jù)準(zhǔn)確推斷生物樣本之間小RNA的變化情況。為了解決這一問題,研究者需要了解測序數(shù)據(jù)的產(chǎn)生過程/局限性以及特殊樣本對測序結(jié)果的影響。文章介紹了sncRNA測序數(shù)據(jù)分析中的主要注意事項(xiàng),分析并討論了不同情況下出現(xiàn)問題的潛在解決方案。 首先,測序結(jié)果分析報告中對sncRNA表達(dá)量的描述不管是原始讀值(raw reads)還是標(biāo)準(zhǔn)化后的讀值(例如reads per million (RPM))往往表示對應(yīng)序列在樣本中的相對富集水平,而非其在樣本中的絕對數(shù)量。因此,不同條件下測序結(jié)果中某個小RNA序列的讀值變化不一定反映出其真實(shí)表達(dá)水平的變化。舉例來說,如果一個細(xì)胞中同時表達(dá) miRNA 和 tsRNA,通過測序發(fā)現(xiàn)在某種處理后miRNA的讀值相對于正常條件中的讀值下降,而tsRNA的相對讀值上升。這種測序結(jié)果的呈現(xiàn)不能簡單理解為miRNA表達(dá)的下調(diào)以及tsRNA的上調(diào),而可能由以下多種情況導(dǎo)致。例如:1)miRNA表達(dá)不變,tsRNA表達(dá)上升。由于測序分析時將樣本總讀值進(jìn)行了標(biāo)準(zhǔn)化,使得測序結(jié)果中miRNA的讀值降低而tsRNA的讀值升高;2)miRNA表達(dá)降低,tsRNA表達(dá)不變。同樣地,對讀值的標(biāo)準(zhǔn)化導(dǎo)致了最終測序分析結(jié)果中miRNA的讀值降低而tsRNA的讀值升高;3)miRNA表達(dá)降低,tsRNA表達(dá)上升(圖 2)。因此,如果只通過讀值本身的變化來評估小RNA表達(dá)的變化是不夠的,甚至?xí)?dǎo)致對測序結(jié)果的系統(tǒng)性誤讀,使得后續(xù)的實(shí)驗(yàn)方向(例如選擇具體上調(diào)/下調(diào)的小RNA進(jìn)行驗(yàn)證研究)與預(yù)期目標(biāo)南轅北轍。
圖2:sncRNA測序結(jié)果中基于RPM的小RNA變化模式可由細(xì)胞內(nèi)部多種表達(dá)情況產(chǎn)生(miRNA, tsRNA的相對變化) 為了校準(zhǔn)測序結(jié)果,其中一種策略是對選定的多個sncRNA進(jìn)行 Northern blot分析,通過被探測的RNA條帶的亮度衡量其真實(shí)表達(dá)量。這一過程中針對不同條件的樣本,較優(yōu)選擇是使用相等的總RNA量,而非使用某些看家(housekeeping)RNA作為內(nèi)參,這是由于這些看家RNA的表達(dá)量在某些條件下也可能發(fā)生改變,從而影響判斷。 另一種矯正策略是通過在構(gòu)建RNA測序文庫過程中添加外源spike-in RNA,從而建立定量標(biāo)準(zhǔn)曲線。然而添加spike-in RNA的基準(zhǔn)選擇尤為重要:如果基于相等的RNA含量添加等量spike-in RNA時在某些情況下也會產(chǎn)生系統(tǒng)性的誤差。例如,在細(xì)胞數(shù)量相等的情況下,一些癌細(xì)胞中總RNA的含量是正常細(xì)胞的2-3倍。如果根據(jù)相同總RNA水平添加等量的spike-in RNA則會導(dǎo)致癌細(xì)胞中小RNA的表達(dá)水平被系統(tǒng)性地低估。因此,文章推薦基于相等細(xì)胞數(shù)量而非相等RNA量添加spike-in RNA。然而,對于含有大量細(xì)胞的組織進(jìn)行細(xì)胞數(shù)目的精確定量并不現(xiàn)實(shí)。而在細(xì)胞數(shù)目很大的情況下,計數(shù)的微小偏差也會帶來小RNA定量的系統(tǒng)性誤差。因此未來的研究方向旨在降低測序測序所需細(xì)胞數(shù)量,理想情況下通過在單細(xì)胞中添加spike-in RNA,從而實(shí)現(xiàn)對小RNA的絕對定量。 【編者按:這些小RNA分析時的問題值得相關(guān)實(shí)驗(yàn)室或測序分析平臺在實(shí)際操作中特別關(guān)注,隨著各種新型sncRNA的出現(xiàn),這已經(jīng)是實(shí)驗(yàn)設(shè)計和生信分析中不可避免需要解決的問題】 對小RNA全修飾譜進(jìn)行直接定量及定位:新方法與新挑戰(zhàn) 過去研究者往往更為關(guān)注小RNA本身的序列,而忽視了小RNA上的修飾信息。但越來越多的證據(jù)表明,RNA修飾信息是小RNA功能中不可或缺的一環(huán),例如對調(diào)節(jié)RNA穩(wěn)定性、RNA結(jié)構(gòu)、RNA結(jié)合的潛力等具有著重要作用。這個問題對于tsRNA等來源于被高度修飾的前體RNA(tRNA擁有超過150種不同類型的RNA修飾)的非經(jīng)典小RNA顯得尤為重要。然而,目前大多數(shù)小RNA的修飾仍然無法被檢測或被定位。這很大程度上是由于當(dāng)前主流的RNA測序方法實(shí)際上是對RNA反轉(zhuǎn)錄獲得的cDNA進(jìn)行測序(而不是RNA序列本身),因此大部分的RNA修飾信息在反轉(zhuǎn)錄過程中被丟失了。目前已有的特定位點(diǎn)的RNA修飾檢測方法往往針對的是長RNA上的修飾,可檢測的修飾種類(例如m5C、m6A、ψ、I、m1A,ac4C)也受到限制,且這些方法通常只能鑒定其中一種修飾類型。為了分析包含大量修飾的非經(jīng)典小RNA的全修飾譜,領(lǐng)域迫切需要可以直接對RNA進(jìn)行測序并同時對所有RNA修飾進(jìn)行定位和定量的方法。針對這一問題,目前有兩類方法正在開發(fā)和發(fā)展中,一是基于新型質(zhì)譜的測序技術(shù),二是基于納米孔的測序技術(shù)(圖3)。 【編者按:由于通過建立cDNA文庫來進(jìn)行RNA測序的方法在同時捕捉多種RNA修飾方面具有固有的局限性,最近多家實(shí)驗(yàn)室聯(lián)合在Nat Genet 2021 (https:///10.1038/s41588-021-00903-1) 發(fā)布了一篇call for action的倡議: 文章旨在鼓勵NIH等主要科研機(jī)構(gòu)應(yīng)當(dāng)大力支持獨(dú)立實(shí)驗(yàn)室從頭開發(fā)新一代不基于逆轉(zhuǎn)錄的RNA直接測序技術(shù),從而對全部RNA修飾進(jìn)行系統(tǒng)解析,這個倡議與本文介紹的內(nèi)容遙相呼應(yīng)】 新型質(zhì)譜技術(shù): 液相色譜串聯(lián)質(zhì)譜(LC-MS/MS)技術(shù)已被廣泛用于分析 RNA 修飾并被認(rèn)為是對RNA修飾定性和定量的“金標(biāo)準(zhǔn)”。LC-MS/MS的傳統(tǒng)優(yōu)勢是可以測量特定的RNA片段或單個核苷酸的分子量,從而推斷出RNA上的修飾種類。然而由于RNA在質(zhì)譜檢測前往往需要被消化成更小的片段或單核苷酸,使得原始RNA修飾的位置信息被丟失。為了解決這一問題,研究人員提出一種可能的實(shí)驗(yàn)方案,即通過處理將RNA逐核苷酸梯度降解成不同長度的RNA片段(形成mass ladder),再利用質(zhì)譜差值獲得末位核苷酸及修飾信息(圖3)。這一方案與Sanger法DNA 測序策略類似。但這一方案的難點(diǎn)在于如何準(zhǔn)確獲得一套完整的mass ladder。 2015 年,Jack Szostak實(shí)驗(yàn)室發(fā)表了一篇具有里程碑意義的論文,開發(fā)了一種通用且高效的方法克服了這一挑戰(zhàn)。他們發(fā)現(xiàn)通過甲酸處理RNA可以可控地對RNA進(jìn)行片段化并生成較為均勻的各個長度的RNA片段,形成了完整的mass ladder,從而實(shí)現(xiàn)了后續(xù)利用LC-MS/MS對RNA進(jìn)行直接從頭測序的同時對各個位點(diǎn)的RNA修飾進(jìn)行直接檢測的策略。一系列基于該項(xiàng)技術(shù)的后續(xù)改進(jìn)也在進(jìn)行中,最終目標(biāo)是實(shí)現(xiàn)針對RNA序列和修飾的高通量直接測序。該項(xiàng)技術(shù)極大地方便了針對tRNA/tsRNA等被高度修飾的RNA的研究,為了解tRNA/tsRNA 的組織特異性及其在正常和疾病條件下的差異提供了重要的研究手段。 【筆者按:Jack Szostak是筆者最佩服的當(dāng)代科學(xué)家之一,Jack因上世紀(jì)80年代參與發(fā)現(xiàn)端粒的工作獲得2009年的諾貝爾生理學(xué)或醫(yī)學(xué)獎,隨后實(shí)驗(yàn)室又開創(chuàng)了aptamer領(lǐng)域,并通過體外’定向進(jìn)化’(directed evolution)手段在人工合成篩選功能性核酶(ribozyme)方面也做出了開創(chuàng)性工作。隨后他又進(jìn)軍更為基礎(chǔ)的問題-研究生命的起源,包括不基于核酶的核酸類似物的化學(xué)復(fù)制,以及原始生物膜的形成等(每個階段的工作都具有劃時代的意義)。值得一提的是,2020年獲得諾獎的Jennifer Doudna,以及miRNA領(lǐng)域的大牛David Bartel都是Jack Szostak實(shí)驗(yàn)室進(jìn)行ribozyme研究時期培養(yǎng)的博士】
圖3:基于質(zhì)譜技術(shù)對RNA序列從頭測序和RNA修飾的定量定位的技術(shù)原理 納米孔技術(shù): 納米孔技術(shù)的開發(fā)來自于對天然膜離子通道結(jié)構(gòu)的研究,其技術(shù)原理是通過記錄不同核酸分子穿過納米孔時形成的離子電流來判斷序列信息。自1996年首次將納米孔技術(shù)用于檢測和鑒定單鏈DNA和RNA序列之后,該技術(shù)迄今已經(jīng)發(fā)展了30多年。納米孔技術(shù)不但為直接DNA/RNA測序帶來一場革命,也有望用于鑒定RNA上的修飾信息。目前,基于納米孔的直接測序技術(shù)已經(jīng)實(shí)現(xiàn)了對m6A、ψ,2'-O-methylation等修飾信息的測序,并基于機(jī)器學(xué)習(xí)對修飾信息進(jìn)行了定位。然而,目前對于同時檢測多個RNA修飾以及被高度修飾的RNA仍然非常困難。 使用納米孔技術(shù)同時準(zhǔn)確定位多個RNA修飾的一大難點(diǎn)在于:一個特定的RNA修飾不但會改變修飾位點(diǎn)的離子電流,而且會影響附近位點(diǎn)的電流(這是由納米孔蛋白的物理和化學(xué)性質(zhì)決定的)(圖 4)。尤其對于tRNA/tsRNA等被高度修飾的RNA而言,不同RNA修飾的影響可產(chǎn)生不計其數(shù)的重疊效應(yīng),為準(zhǔn)確判定修飾位置帶來很大的困難。理論上可以通過合成各種不同的帶有已知修飾的RNA獲得數(shù)據(jù)建立機(jī)器學(xué)習(xí)模型解決該問題。然而由于目前許多RNA修飾還不能進(jìn)行有效的實(shí)驗(yàn)室合成使得這一方向困難重重,仍然需要大量的技術(shù)投入。 提高納米孔測序準(zhǔn)確性的另一個方向是改進(jìn)(例如位點(diǎn)特異性突變)現(xiàn)有的納米孔道蛋白,采用新的孔道蛋白或者使用其它不基于蛋白的新型納米材料孔道,最終找到能夠更準(zhǔn)確靈敏檢測特定RNA及其 修飾的孔道材料。
圖4:基于納米孔技術(shù)對一條RNA上多種RNA修飾進(jìn)行定位的主要問題以及今后的改進(jìn)方向 總結(jié)與展望 除了系統(tǒng)捕獲具有所有小RNA及其RNA修飾以外,小RNA在亞細(xì)胞水平的空間組學(xué)仍方興未艾。相對于mRNA/lncRNA的空間轉(zhuǎn)錄組研究,小RNA的空間組學(xué)研究難度更大。這主要是因?yàn)樾NA的序列較短,不容易獲得特異的原位雜交信號;另外小RNA上的密集修飾也可能影響探針雜交效率。這些均為今后亟待解決的問題。 另一個更為深層和長期的問題是如何研究小RNA的功能和工作機(jī)理。文章使用“RNA代碼”來描述小RNA其所包含的復(fù)雜信息,其中包括但不限于它們的序列信息及位點(diǎn)特異性RNA修飾信息;它們與靶RNA、DNA及蛋白結(jié)合的能力,以及小RNA在細(xì)胞內(nèi)和細(xì)胞間的社會行為(如競爭和協(xié)同對共同目標(biāo)的影響)。如何結(jié)合細(xì)胞生理學(xué)特性系統(tǒng)地解碼這些RNA信息在當(dāng)下仍然極具挑戰(zhàn)性,同時這也說明小RNA的研究代表了一個無盡的前沿方向,值得新一代研究人員(和機(jī)器)運(yùn)用其智慧進(jìn)行不斷探索。 【編者按:本中文報道僅節(jié)選了綜述中部分重要內(nèi)容,對小RNA研究感興趣的老師同學(xué)建議閱讀原文】 原文鏈接: https:///10.1038/s41556-022-00880-5 |
|
|