小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

使用TASSEL學(xué)習(xí)GWAS筆記(4/6):一般線性模型進(jìn)行GWAS分析(GLM模型)

 育種數(shù)據(jù)分析 2021-11-18

筆記計(jì)劃分為六篇:

第一篇:讀取plink基因型數(shù)據(jù)和表型數(shù)據(jù)

第二篇:對(duì)基因型數(shù)據(jù)質(zhì)控:缺失質(zhì)控,maf質(zhì)控,hwe質(zhì)控,樣本質(zhì)控

第三篇:基因型數(shù)據(jù)可視化:kingship,MDS,PCA

第四篇:一般線性模型進(jìn)行GWAS分析(GLM模型) 

第五篇:混合線性模型進(jìn)行GWAS分析(MLM模型) 

第六篇:TASSEL結(jié)果可視化:QQ plot,曼哈頓圖

已完成前三篇,本篇是第四篇。

1. 將質(zhì)控的plink數(shù)據(jù)和表型數(shù)據(jù)讀入到TASSEL軟件

質(zhì)控后的plink數(shù)據(jù)和表型數(shù)據(jù):

「讀取表型數(shù)據(jù)到TASSEL中:」

「讀取基因型數(shù)據(jù)到TASSEL中:」

2. 一般線性模型(GLM)介紹

GLM模型中,將每個(gè)SNP作為固定因子進(jìn)行回歸分析,進(jìn)行顯著性檢驗(yàn),P值就是GWAS分析的p-value,effect就是SNP的effect值。如果有其它因素需要考慮,就放到協(xié)變量里面,比如性別,PCA,Q矩陣等。

重點(diǎn)是對(duì)每個(gè)SNP做回歸分析,提取effect和p-value。

3. 合并數(shù)據(jù)

TASSEL分析中,需要將分析的表型和基因型數(shù)據(jù)進(jìn)行合并,合并為一個(gè)數(shù)據(jù)框,然后對(duì)該數(shù)據(jù)框進(jìn)行分析。

3.1 對(duì)基因型數(shù)據(jù)進(jìn)行PCA分析

選中qc_plink基因型數(shù)據(jù),點(diǎn)擊菜單 Analysis --> Relatedness --> PCA,然后點(diǎn)擊確定即可。

「PCA分析結(jié)果:」

3.2 將PCA+表型+基因型合并

選中三個(gè)數(shù)據(jù),然后點(diǎn)擊Data中的Intersect Join,進(jìn)行數(shù)據(jù)合并。

3.3 查看合并后的數(shù)據(jù)

可以看到,數(shù)據(jù)中包括ID,PCA及結(jié)果,表型性狀數(shù)據(jù),基因型數(shù)據(jù)。

4. GLM模型

選中合并后的書,點(diǎn)擊Analysis --> Association --> GLM點(diǎn)擊OK,即可。

5. GLM結(jié)果查看

可以看到,Result中有兩個(gè)GLM結(jié)果,第一個(gè)為GWAS結(jié)果,第二個(gè)為每個(gè)SNP的效應(yīng)值情況??吹谝粋€(gè)就行。因?yàn)檫@是多個(gè)性狀的分析,所以所有結(jié)果放在了一起。

  • 第一列為性狀,這里包括三個(gè)性狀,在進(jìn)行作圖時(shí)需要將數(shù)據(jù)分開
  • 第二列為SNP名稱
  • 第三列為染色體名稱
  • 第四列為SNP的物理位置
  • 第五列為F檢驗(yàn)結(jié)果
  • 第六列為p值
  • ……

6. 導(dǎo)出結(jié)果


7. TASSEL中的結(jié)果可視化

「QQ圖:」

「曼哈頓圖:」

這里,曼哈頓圖需要指定性狀,這里我們選擇EarDia這個(gè)性狀進(jìn)行可視化:

圖片可以保存到本地。

ok,第四篇搞定了。下一篇是MLM模型的分析,歡迎繼續(xù)關(guān)注。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多