今天介紹一下如何使用plink計(jì)算PIC,PIC的意思是多態(tài)信息含量 (polymorphism information content,PIC)。多態(tài)信息含量(polymorphism information content,PIC)是衡量遺傳標(biāo)記(如 DNA 分子標(biāo)記、等位基因等)在群體中多態(tài)性水平的重要指標(biāo),用于評(píng)估標(biāo)記提供的遺傳信息豐富度,反映其區(qū)分不同基因型個(gè)體的能力。它廣泛應(yīng)用于遺傳學(xué)研究、分子育種、群體遺傳結(jié)構(gòu)分析等領(lǐng)域。PIC 的本質(zhì)是:對(duì)于一個(gè)遺傳標(biāo)記,在隨機(jī)選擇的兩個(gè)雜合子親本后代中,該標(biāo)記能明確區(qū)分親本基因型的概率。簡(jiǎn)單來(lái)說(shuō),PIC 值越高,標(biāo)記的多態(tài)性越強(qiáng),能提供的遺傳信息越豐富,在區(qū)分個(gè)體或群體遺傳差異時(shí)的效果越好。參考文獻(xiàn):Botstein D, White R L, Skolnick M, et al. Construction of a genetic linkage map in man using restriction fragment length polymorphisms[J]. American journal of human genetics, 1980, 32(3): 314.如何使用plink的maf結(jié)果計(jì)算PIC?1,對(duì)基因型數(shù)據(jù)進(jìn)行質(zhì)控plink --file new_id_dd --chr-set 40 --snps-only just-acgt --chr 1-18 --mind 0.1 --geno 0.1 --hwe 1e-5 --recode --out templibrary(data.table)library(tidyverse)freq=fread(file="plink.frq",header=T)head(freq)summary(freq)freq$Pic=1-freq[,5]^2-(1-freq[,5])^2-2*(1-freq[,5])^2*freq[,5]^2head(freq)summary(freq)cor(freq$MAF,freq$Pic)plot(freq$MAF,freq$Pic)fwrite(freq,"pic_result_maf.txt",sep = " ",quote = F)
1,快來(lái)領(lǐng)取 | 飛哥的GWAS分析教程 2,飛哥匯總 | 入門數(shù)據(jù)分析資源推薦
3,數(shù)量遺傳學(xué),分享幾本書的電子版 4,R語(yǔ)言學(xué)習(xí)看最新版的電子書不香嘛? 5,領(lǐng)取 | GWAS和統(tǒng)計(jì)遺傳書籍匯總 6,【零基礎(chǔ)入門?實(shí)戰(zhàn)特訓(xùn)】GWAS 分析培訓(xùn)會(huì)
|