小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

LDblock繪制連鎖不平衡和單體型圖

 育種數(shù)據(jù)分析 2022-10-27 發(fā)布于河南

大家好,我是鄧飛。

在GWAS分析中,我們挖掘到了一些顯著性的位點(diǎn),如何確定這些位點(diǎn)是不是假陽(yáng)性呢?我們可以通過(guò)LDblock分析并進(jìn)行可視化進(jìn)行判斷。

我們知道GWAS分析中是依據(jù)SNP與性狀控制的基因存在LD,所以如果位點(diǎn)顯著,則周?chē)鷳?yīng)該有一些位點(diǎn)都顯著,或者說(shuō)位點(diǎn)所在的區(qū)域LD值比較高,能形成Block,才比較靠譜。否則,顯著性為點(diǎn)形單影只,并且沒(méi)有形成Block,極大可能是假陽(yáng)性!

下面介紹如何通過(guò)基因型數(shù)據(jù)和GWAS分析結(jié)果,繪制LDblock。

「要實(shí)現(xiàn)的下面的圖:」

  • 最下方的熱圖是兩兩SNP之間的LD值,越高越紅,比較紅的區(qū)域構(gòu)成一個(gè)Block(用黑線(xiàn)連起來(lái))
  • 如果提供gff文件,可以顯示基因的上游、下游、外顯子、內(nèi)含子區(qū)域
  • 上面是位點(diǎn)的曼哈頓圖,是區(qū)域性的曼哈頓圖
  • 位點(diǎn)之間,也可以根據(jù)LD值進(jìn)行可視化,以最顯著的位點(diǎn)為四方形,其它位點(diǎn)與其LD值的大小呈現(xiàn)不同的顏色

軟件介紹:(這兩款神奇是一人開(kāi)發(fā),大神呀?。?github鏈接:https://github.com/BGI-shenzhen/

  • A:整體上宏觀上用:PopLDdecay 軟件 ,軟件己經(jīng)生物信息Bioinformatics雜志發(fā)表online(見(jiàn)我的學(xué)習(xí)筆記:LD衰減圖繪制--PopLDdecay
  • B: 從局部上查看用:LDBlockShow軟件, 軟件已經(jīng)正式被 briefings in bioinformatics (影響分子8.99)的雜志接收

1. 數(shù)據(jù)準(zhǔn)備

  • vcf格式的數(shù)據(jù),InVCF
  • plink二進(jìn)制文件,InPlink
  • plink文本文件,InPlink

2. 軟件安裝

網(wǎng)址:https://github.com/BGI-shenzhen/LDBlockShow

中文說(shuō)明書(shū):https://github.com/hewm2008/LDBlockShow/blob/main/LDBlockShow_Manual_Chinese.pdf

安裝代碼:

        git clone https://github.com/hewm2008/LDBlockShow.git
        cd LDBlockShow ; chmod 755 configure  ;  ./configure;
        make;
        mv LDBlockShow  bin/;    #     [rm *.o]

3. 軟件測(cè)試

數(shù)據(jù):file.vcf

代碼:這里,繪制染色體1,位置區(qū)間是:49670000:49780000

LDBlockShow -InVCF file.vcf -OutPut re5 -Region 1:49670000:50680000 -OutPng -SeleVar 1

結(jié)果:

在這里插入圖片描述

4. 進(jìn)階:Heatmap + block

vcf文件:Test.vcf.gz

在這里插入圖片描述

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re1 -Region chr11:24100000:24200000 -OutPng -SeleVar 1

結(jié)果文件:

re1.blocks.gz  re1.png  re1.site.gz  re1.svg  re1.TriangleV.gz

5. 進(jìn)階:Heatmap + block + GWAS

考慮GWAS的結(jié)果,加入?yún)?shù):-InGWAS gwas.pvalue

vcf文件:Test.vcf.gz

GWAS結(jié)果文件:三列,Chr, Position, Pvalue,沒(méi)有行頭

$ head gwas.pvalue
chr11 24142640 0.00009
chr11 24142660 1.02e-9
chr11 24142669 1e-9
chr11 24142692 0.5
chr11 24142724 0.6
chr11 24142756 0.001
chr11 24142760 0.006

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re2 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1

結(jié)果:

re2.blocks.gz  re2.png  re2.site.gz  re2.svg  re2.TriangleV.gz

結(jié)果中包括熱圖,block圖和GWAS圖合并起來(lái)了。

上面的圖,可以通過(guò)ShowLDSVG軟件,進(jìn)一步優(yōu)化:

  • -Cutline,閾值定義為7
  • -ShowNum,顯示LD值
  • -PointSize,顯示點(diǎn)大小
 ShowLDSVG -InPreFix re2 -OutPut temp -InGWAS gwas.pvalue -Cutline 7 -ShowNum -PointSize 3

結(jié)果:

6. Heatmap + block + GWAS + Annotation

相比較上圖,增加了注釋的信息。

文件需要:

  • vcf,vcf格式的文件
  • gwas_pvalue,三列的gwas結(jié)果(Chr,Position,Pvalue),無(wú)行頭
  • gff文件,注釋文件
$ cat In.gff
chr11 maker mRNA 24142646 24142738 . + . ID=GeneName
chr11 maker five_prime_UTR 24142646 24142652 . - . Parent=GeneName
chr11 maker CDS 24142653 24142673 . + 2 Parent=GeneName
chr11 maker CDS 24142718 24142729 . + 2 Parent=GeneName
chr11 maker five_prime_UTR 24142730 24142738 . + . Parent=GeneName

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff

也可以增加SNP的名稱(chēng):

$ cat Spe.snp
chr11 24142660
chr11 24142669 SpeA
chr11 24142760 SpeB

命令:

LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff -SpeSNPName Spe.snp

7. 進(jìn)階:LDblock+GWAS+Annotation+Locuszoom

可以通過(guò)-TopSite在GWAS圖中顯示最顯著位點(diǎn)與其它位點(diǎn)的LD關(guān)系。

LDBlockShow -InVcf Test.vcf.gz -OutPut re4 -InGWAS gwas.pvalue -InGFF In.gff -Region chr11:24100000:24200000 -OutPng -SeleVar 3 -TopSite

下圖中,最顯著的位點(diǎn)為四邊形,其它顏色,紅色表示LD高,其它顏色表示LD低。在上圖的基礎(chǔ)上,增加了最顯著位點(diǎn)與其它位點(diǎn)的LD情況。

參考:https://github.com/hewm2008/LDBlockShow/blob/main/LDBlockShow_Manual_Chinese.pdf

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多