小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

雙端測序中read1和read2的關(guān)系

 生物_醫(yī)藥_科研 2019-02-13

??在跟著健明老師學(xué)習(xí)生物信息學(xué)的過程中,少走了很多彎路,躲過了很多坑,在指導(dǎo)下淺嘗過一些。但是自己常常扣原理,又雙叒叕落坑,百思不得其解。
以下是之前遇到的問題,今天整理帶大家一起分析分析,若有不嚴(yán)謹(jǐn)或者錯誤的地方,強(qiáng)烈歡迎指正

問題1
??首先,我們討論一個問題,我們都知道同源染色體上的堿基并不完全相同,但是為什么參考基因組參考序列是單序列而不是雙序列呢?

我們需要了解“人類基因組計劃”“千人基因組計劃”以及2017-12-28央視宣布我國啟動“中國10萬人基因組計劃”

??人類細(xì)胞內(nèi)共有22對常染色體,2對性染色體,共24條染色體。人體有23對,46條染色體,但卻測定24條染色體.說明有部分染色體無需全測,這很自然的就聯(lián)想到“常染色體每對是互補(bǔ)配對”的性質(zhì),說明,每對染色體中的兩條,基因相同,只需測一條就可知另一條的基因。如果是這樣的話,需測22對常染色體,那么剩下的就自然是兩條性染色體,因為X染色體與Y染色體構(gòu)造有所不同(Y染色體比X少一部分),所以兩條都要測。
??則一共22條常染色體+2條性染色體=24條染色體。

??然后有人想到了同源染色體上等位基因的情況:

??等位基因(allele)又作allelomorph.可能出現(xiàn)在染色體某特定座位上的兩個或多個基因中的一個。若一個座位上的基因以兩個以上的狀態(tài)存在,便稱為復(fù)等位基因。若成對的等位基因中兩個成員完全相同,則該個體對此性狀來說成為純合子。若兩個等位基因各不相同,則該個體對該性狀來說是雜合子。由于等位基因都對應(yīng)同一性狀,所以只要測其中一個,其等位基因會作為特殊基因單獨測序,但不作為人類基因組計劃另外測定。同源染色體具體的序列不一樣,但是結(jié)構(gòu)是一樣的,所以沒必要多測。也就是說人類基因組計劃要搞清楚的是基因片段與性狀的關(guān)系,重點不在堿基序列。
??因為同源染色體上的顯隱性基因控制的是同一性狀的不同表現(xiàn)類型!就好比紅綠色盲基因和色覺正常基因是位于同源染色體上的同一位置的!基因測序時,只要知道這個位置的基因是控制色覺的就行了!這大概就是人類基因組計劃的目的(通俗意思,請自行谷歌客觀了解)


接下來我們回顧以下測序過程:引出其他問題


PCR+測序
測序得到兩條read

問題2
測序過程中以上圖很明顯read1和read2為interset區(qū)域兩條互補(bǔ)鏈并且方向相對的兩部分序列,那測序過程中如何實現(xiàn)將此兩條序列比對到單鏈的參考基因組呢?

??為了得到答案,翻書,谷歌,看原理視屏依然沒有解決問題,于是在熟練Linux和各文件格式之后,我找了真實fq數(shù)據(jù)中的一對reads一探究竟。
步驟1:找出具體信息為CAY9KANXX:5:1101:1113:2067的一對fq(一對reads),笨辦法列出所有堿基,如下圖:

圖1:fq_reads

??根據(jù)原理,我們可以知道上圖中的fq1和fq2是實際測序得到的read1和read2。
注意:Excel排版原因?qū)ead1和read2顯示長短不一,經(jīng)過計算實際均為150個堿基。


步驟2:然后在得到原始sam/bam文件中找到這對reads,并列出堿基觀察(:

圖2:sam/bam_reads

??仔細(xì)肉眼比對圖二和圖一,發(fā)現(xiàn)bam文件中reads2已被轉(zhuǎn)義并且倒序排列。為什么這么確定是倒序過來的呢?細(xì)心的人會發(fā)現(xiàn)reads的質(zhì)量值是倒過來的。到此問題2已經(jīng)得到的解釋。

為了徹底搞清楚,我們在IGV中可視化直觀看一下:

我將圖2中的重復(fù)堿基標(biāo)紅,將這兩條序列的bam文件導(dǎo)入IGV中可視化:

圖3:IGV可視化

圖3中,非常直觀看到兩條帶方向箭頭的灰色條帶(read1和read2)的比對到單序列的參考基因組(下方彩色條帶)。


??為了更加直觀,讓自己死心(我也是服了自己那顆躁動的心),我把對應(yīng)參考序列也列出來了,模擬了一下IGV的比對情況,如圖:

圖4:比對

依然要總結(jié)一下:
??雙端測序下機(jī)數(shù)據(jù)中得到的read1和read2是兩條互補(bǔ)鏈insertsize中方向相對的兩條序列,再比對到單鏈的參考基因組之前會先將其中一條read轉(zhuǎn)義,然后進(jìn)行比對,所以比對得到的SAM和BAM文件中read1和read2有一條是被轉(zhuǎn)了的。
??全劇終。。。。。。
參考:
??1.生信技能樹健明大牛線下培訓(xùn)
??2.基因課視屏截圖
??3.陳巍學(xué)基因

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多