小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

孟德爾隨機化---R語言VCF文件讀取

 昵稱69125444 2023-09-21

有何AI與醫(yī)學:開始補充一些文章解析,以及之前沒有寫過,但是有朋友咨詢的內(nèi)容

01 下載數(shù)據(jù)


圖片

VCF文件是GWAS中常見的一種格式,我這里使用IEU下載得到的VCF文件進行演示,鏈接放到這個里,大家可以下載練習:https://gwas./datasets/ieu-a-1055/

圖片

02 安裝軟件


圖片

VCF文件這里我們使用vcfR包來讀取。

# 清空環(huán)境變量,如果環(huán)境有后面需要的變量,只要不報錯不清楚也可以
rm(list=ls())
#設置工作目錄
setwd("~/vcfdata/")
#讀取文件
#下載vcfR包
install.packages("vcfR")

03 讀取數(shù)據(jù)


圖片

#讀取VCF文件,我這里下載了IEU數(shù)據(jù)庫數(shù)據(jù)
data <- vcfR::read.vcfR("ieu-a-1055.vcf.gz")
#如注釋文件所示,ES代表beta值、SE代表se、LP代表-log10(P值)、AF代表eaf、“ID”代表SNP的ID
gt <- data.frame(data@gt)
dat <- as.character(unlist(strsplit(gt$ieu.a.1055split = ":")))#strsplit切分;unlist解開
fix<-data.frame(data@fix)#為SNP位點的基本信息
#轉(zhuǎn)化為data.frame
matrix<-matrix(data=dat,ncol=5,byrow=T)
frame<-data.frame(matrix) 
# 獲取到的列命名
colnames(frame)<-c("ES","SE","LP","AF","ID")
exp<-cbind(fix,frame)

讀取數(shù)據(jù)后我們先看一下,vcf如下圖所以,vcf文件由三個部分組組成,meta,fix,gt。

圖片

meta部分主要是注釋信息,如數(shù)據(jù)的列名注釋等。

圖片

gt fix 兩個儲存看具體信息,gt為ES代表beta值、SE代表se、LP代表-log10(P值)、AF代表eaf、“ID”代表SNP的ID。fix儲存的為染色體編號和位置,SNPID,REF參考等位基因頻率,ALT等位基因頻率。

圖片

之后按代碼整理,將兩部分合并,生成exp如下圖。

圖片

007

交流群

如果覺您覺得本公眾號可以對您帶來幫助,可在文章中給我們簡短致謝!:Thanks to Xu Zhang of Youhe AI and Medicine。

需要加入孟德爾隨機化交流群的朋友加我微信拉大家,微信號:

dxchzx(為保證交流環(huán)境,一定注明姓名,單位來意)。

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章