小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

liftOver 不同版本基因組文件相互轉(zhuǎn)化

 育種數(shù)據(jù)分析 2023-05-30 發(fā)布于河南

大家好,我是鄧飛。前一段時間有小伙伴在星球提問:想將不同版本的SNP數(shù)據(jù)合并,不想重新call snp,想把綿羊的V2和V4版本的數(shù)據(jù)合并,具體來說,是V2轉(zhuǎn)為V4然后與V4合并。

我建議用liftOver軟件進行處理,并許諾寫篇博客介紹一下。還有小伙伴想把1.2的參考基因組,變?yōu)?.1的,問我如何處理,我還是建議用liftOver,在線網(wǎng)站也可以解決,但是本地編程更快一些。

1. 不同基因組轉(zhuǎn)換對應(yīng)關(guān)系原理

每一次參考基因組的更新,位置信息會有所變化,有些是插入了一些,有些是平移,有些是沒有改變。

但是,每一個版本的參考基因組,都有對應(yīng)的關(guān)系,如果我們根據(jù)對應(yīng)的關(guān)系,就可以把舊版本的更新到新版本的位置。

應(yīng)用領(lǐng)域:不同參考基因組call snp的vcf數(shù)據(jù),可以通過這種方式轉(zhuǎn)換為同一基因組版本,然后合并。有些芯片設(shè)計時是不同的基因組版本,也可以通過這種形式,進行轉(zhuǎn)換,然后合并。

2. liftOver軟件下載

網(wǎng)址:http://hgdownload.cse./admin/exe/

有蘋果系統(tǒng)和Linux系統(tǒng),這里以Linux系統(tǒng)為例進行介紹。

3. 查找物種的基因組版本

網(wǎng)址:https://hgdownload.soe./downloads.html

常見的物種都有:

比如豬的版本有:

  • · V11

  • · V10

  • · V9

雞的有:

  • · V6

  • · V5

  • · V4

牛的有:

  • · V9,V8,V7

人的有:

  • · hg38

  • · hg19

  • · mm39

  • · mm10

4. 下載不同版本的liftOver數(shù)據(jù)文件

比如,這里以雞為例子,進入網(wǎng)站:https://hgdownload.soe./goldenPath/galGal6/liftOver/

這里由V6變?yōu)閂5,V6變?yōu)閂4:,我們想把V6變?yōu)閂5,可以下載:

當(dāng)然,也可以V5變?yōu)閂6,V4變?yōu)閂6,只需要下載對應(yīng)的chain文件即可:

注意,下載的gz文件,不要解壓縮。保持壓縮狀態(tài)

5. 整理位置信息

我們以plink數(shù)據(jù)為例,我們想把v5版的map變?yōu)関6版的map,首先將map數(shù)據(jù)變?yōu)閎ed的格式:

將位置信息整理為bed文件,可以根據(jù)map進行整理,染色體,開始位置,結(jié)束位置,沒有行頭。

只接受BED格式文件,BED格式文件只定義前三列:chr start end,無表頭 注:end不等于start(如果是單位點的話,建議所有end = start+1)

轉(zhuǎn)換代碼:

sed 's/\s\+/ /g' new_v3.map >t1.map
awk '{print "chr"$1,$4,$4+1}' t1.map >tt.bed

6. 運行l(wèi)iftOver命令行轉(zhuǎn)換

liftOver的語法為:

liftOver <輸入文件> <chain文件> <輸出文件> <unmapped文件>

示例代碼:

將bed的V6版本,變?yōu)閂5版本:

liftOver tt.bed galGal6ToGalGal5.over.chain.gz re_map.bed re_un_map.bed
  • · 第一個參數(shù),tt.bed,就是bed文件,根據(jù)map生成的bed文件

  • · 第二個參數(shù),是根據(jù)liftOver網(wǎng)站,下載的壓縮文件,是對應(yīng)關(guān)系,網(wǎng)址:https://hgdownload.soe./goldenPath/galGal5/liftOver/

  • · 第三個參數(shù),是輸出的結(jié)果文件

  • · 第四個參數(shù),是沒有匹配的結(jié)果文件

結(jié)果會輸出成功轉(zhuǎn)換的位點,和沒有轉(zhuǎn)換的位點。

為了方便我們后續(xù)使用,可以先運行一遍代碼,將沒有轉(zhuǎn)換成功的位點刪掉,然后再轉(zhuǎn)換,這樣就是一一對應(yīng)的了。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多