|
大家好,我是鄧飛。 在GWAS分析中,我們挖掘到了一些顯著性的位點(diǎn),如何確定這些位點(diǎn)是不是假陽(yáng)性呢?我們可以通過(guò)LDblock分析并進(jìn)行可視化進(jìn)行判斷。 我們知道GWAS分析中是依據(jù)SNP與性狀控制的基因存在LD,所以如果位點(diǎn)顯著,則周?chē)鷳?yīng)該有一些位點(diǎn)都顯著,或者說(shuō)位點(diǎn)所在的區(qū)域LD值比較高,能形成Block,才比較靠譜。否則,顯著性為點(diǎn)形單影只,并且沒(méi)有形成Block,極大可能是假陽(yáng)性! 下面介紹如何通過(guò)基因型數(shù)據(jù)和GWAS分析結(jié)果,繪制LDblock。 「要實(shí)現(xiàn)的下面的圖:」 - 最下方的熱圖是兩兩SNP之間的LD值,越高越紅,比較紅的區(qū)域構(gòu)成一個(gè)Block(用黑線(xiàn)連起來(lái))
- 如果提供gff文件,可以顯示基因的上游、下游、外顯子、內(nèi)含子區(qū)域
- 上面是位點(diǎn)的曼哈頓圖,是區(qū)域性的曼哈頓圖
- 位點(diǎn)之間,也可以根據(jù)LD值進(jìn)行可視化,以最顯著的位點(diǎn)為四方形,其它位點(diǎn)與其LD值的大小呈現(xiàn)不同的顏色
軟件介紹:(這兩款神奇是一人開(kāi)發(fā),大神呀?。?github鏈接:https://github.com/BGI-shenzhen/
- A:整體上宏觀上用:PopLDdecay 軟件 ,軟件己經(jīng)生物信息Bioinformatics雜志發(fā)表online(見(jiàn)我的學(xué)習(xí)筆記:LD衰減圖繪制--PopLDdecay)
- B: 從局部上查看用:LDBlockShow軟件, 軟件已經(jīng)正式被 briefings in bioinformatics (影響分子8.99)的雜志接收
1. 數(shù)據(jù)準(zhǔn)備2. 軟件安裝網(wǎng)址:https://github.com/BGI-shenzhen/LDBlockShow 中文說(shuō)明書(shū):https://github.com/hewm2008/LDBlockShow/blob/main/LDBlockShow_Manual_Chinese.pdf 安裝代碼: git clone https://github.com/hewm2008/LDBlockShow.git cd LDBlockShow ; chmod 755 configure ; ./configure; make; mv LDBlockShow bin/; # [rm *.o]
3. 軟件測(cè)試數(shù)據(jù):file.vcf 代碼:這里,繪制染色體1,位置區(qū)間是:49670000:49780000 LDBlockShow -InVCF file.vcf -OutPut re5 -Region 1:49670000:50680000 -OutPng -SeleVar 1
結(jié)果: 在這里插入圖片描述4. 進(jìn)階:Heatmap + blockvcf文件:Test.vcf.gz 在這里插入圖片描述命令: LDBlockShow -InVCF Test.vcf.gz -OutPut re1 -Region chr11:24100000:24200000 -OutPng -SeleVar 1
結(jié)果文件: re1.blocks.gz re1.png re1.site.gz re1.svg re1.TriangleV.gz
 5. 進(jìn)階:Heatmap + block + GWAS考慮GWAS的結(jié)果,加入?yún)?shù):-InGWAS gwas.pvalue vcf文件:Test.vcf.gz GWAS結(jié)果文件:三列,Chr, Position, Pvalue,沒(méi)有行頭
$ head gwas.pvalue chr11 24142640 0.00009 chr11 24142660 1.02e-9 chr11 24142669 1e-9 chr11 24142692 0.5 chr11 24142724 0.6 chr11 24142756 0.001 chr11 24142760 0.006
命令: LDBlockShow -InVCF Test.vcf.gz -OutPut re2 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1
結(jié)果: re2.blocks.gz re2.png re2.site.gz re2.svg re2.TriangleV.gz
結(jié)果中包括熱圖,block圖和GWAS圖合并起來(lái)了。
上面的圖,可以通過(guò)ShowLDSVG軟件,進(jìn)一步優(yōu)化: ShowLDSVG -InPreFix re2 -OutPut temp -InGWAS gwas.pvalue -Cutline 7 -ShowNum -PointSize 3
結(jié)果: 6. Heatmap + block + GWAS + Annotation相比較上圖,增加了注釋的信息。 文件需要: - gwas_pvalue,三列的gwas結(jié)果(Chr,Position,Pvalue),無(wú)行頭
$ cat In.gff chr11 maker mRNA 24142646 24142738 . + . ID=GeneName chr11 maker five_prime_UTR 24142646 24142652 . - . Parent=GeneName chr11 maker CDS 24142653 24142673 . + 2 Parent=GeneName chr11 maker CDS 24142718 24142729 . + 2 Parent=GeneName chr11 maker five_prime_UTR 24142730 24142738 . + . Parent=GeneName
命令: LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff
 也可以增加SNP的名稱(chēng): $ cat Spe.snp chr11 24142660 chr11 24142669 SpeA chr11 24142760 SpeB
命令: LDBlockShow -InVCF Test.vcf.gz -OutPut re3 -Region chr11:24100000:24200000 -InGWAS gwas.pvalue -OutPng -SeleVar 1 -InGFF In.gff -SpeSNPName Spe.snp
 7. 進(jìn)階:LDblock+GWAS+Annotation+Locuszoom可以通過(guò)-TopSite在GWAS圖中顯示最顯著位點(diǎn)與其它位點(diǎn)的LD關(guān)系。 LDBlockShow -InVcf Test.vcf.gz -OutPut re4 -InGWAS gwas.pvalue -InGFF In.gff -Region chr11:24100000:24200000 -OutPng -SeleVar 3 -TopSite
下圖中,最顯著的位點(diǎn)為四邊形,其它顏色,紅色表示LD高,其它顏色表示LD低。在上圖的基礎(chǔ)上,增加了最顯著位點(diǎn)與其它位點(diǎn)的LD情況。 參考:https://github.com/hewm2008/LDBlockShow/blob/main/LDBlockShow_Manual_Chinese.pdf
|