小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

淺談Deeptools—生信之深海利器

 生物_醫(yī)藥_科研 2019-08-11

淺談Deeptools—生信之深海利器

做生信分析的,哪一個(gè)方向不得有一兩個(gè)可依賴(lài)的軟件,而近來(lái)我被Google團(tuán)隊(duì)開(kāi)發(fā)的Deeptools的美貌與才華深深吸引 ,它能夠有效的分析對(duì)deep-sequencing數(shù)據(jù)進(jìn)行分析與可視化,是ChIP-seq,ATAC-seq 等分析的利器。
或許大家會(huì)有疑問(wèn) Deeptools=“美貌”+“才華”?楊瀾曾說(shuō):“人們沒(méi)有義務(wù)從你邋遢的外表來(lái)了解你的內(nèi)在美”,那么我們先來(lái)瞅瞅Deeptools的外在美,二話(huà)不說(shuō),果斷上圖.
1. 軟件說(shuō)明文檔中的美圖: 

https://www./figure/Examples-of-images-created-with-deepTools-A-Overview-of-the-deepTools-workflow-that_fig2_262076117

2. 歷年高分文章中的Deeptools美圖:

Embryonic transcription is controlled by maternally defined chromatin state 

Two independent modes of chromatin organization revealed by cohesin removal

The pioneer factor OCT4 requires the chromatin remodeller BRG1 to support gene regulatory element function in mouse embryonic stem cells

如此美貌,是否讓你心動(dòng)?
既然心動(dòng),就讓我們繼續(xù)看看它的才華,也就是說(shuō)它能干什么?
首先Deeptools 能夠處理BAM 和bigWig 文件,而它其中有以下這些模塊,讓我來(lái)簡(jiǎn)述一下這些模塊的基本功能~~
multiBamSummary
針對(duì)bam文件,用來(lái)計(jì)算兩個(gè)或者多個(gè)bam文件在特定基因區(qū)域的覆蓋的reads數(shù)
multiBigwigSummary
針對(duì)BigWig文件,可計(jì)算多個(gè)bigWig文件特定基因區(qū)域的信號(hào)值
correctGCBias
主要針對(duì)GC偏好性對(duì)數(shù)據(jù)進(jìn)行矯正。
bamCoverage
這塊的主要功能呢,簡(jiǎn)單來(lái)說(shuō)就是吃進(jìn)去的是bam文件,流出來(lái)的是bigWig或者bedGraph,以劃bin的形式計(jì)算每個(gè)bin的reads 覆蓋度,用于IGV或則UCSC的基因區(qū)域展示,如下圖所示:

bamCompare
bamCoverage 功能相似,只是bamCompare是基于兩個(gè)bam文件的比較
bigwigCompare
bigwigCompare也是針對(duì)于兩個(gè)bigwig文件,將基因組以劃bin的形式,計(jì)算這兩個(gè)bigwig文件在每個(gè)bin覆蓋深度的比值
computeMatrix
此模塊主要為后期的數(shù)據(jù)可視化模塊plotHeatmap and plotProfiles.服務(wù),針對(duì)bigWig文件,它用來(lái)計(jì)算對(duì)基因區(qū)域以及上下游劃bin,計(jì)算每個(gè)bin內(nèi)ChIP的信號(hào)強(qiáng)度
 
其次Deeptools可以對(duì)數(shù)據(jù)進(jìn)行質(zhì)控
plotCorrelation
主要是針對(duì)multiBamSummary 產(chǎn)生的矩陣,利用pearson 或者spearman 計(jì)算樣本間的相關(guān)性

computeGCBias

Benjamini’s 的方法計(jì)算GC-bias 并進(jìn)行可視化展示,如下圖所示:

對(duì)DeepTools的模塊的功能的簡(jiǎn)述,只能算是拋磚引玉,若是你已經(jīng)被DeepTools的才華所吸引,那么一定要看Deeptools的官方文檔,詳細(xì)鏈接如下:http://deeptools./en/latest/index.html

知道了DeepTools的滿(mǎn)腹才華,如何才能發(fā)揮DeepTools的作用呢?在此,小編想要細(xì)致的介紹兩個(gè)模塊的使用,以來(lái)給大家舉個(gè)栗子

· Correlation between BAM files 計(jì)算bam文件相關(guān)性)

· multiBamSummary

· 原理:

· 將基因組劃bin,通過(guò)bam文件計(jì)算每個(gè)bin reads的覆蓋度(Coverage)

· 用法:

· multiBamSummary  bins  --bamfiles  H3K9me3.sort.bam H3k27me3.sort.bam  H3K4me3.sort.bam H3K4me1.sort.bam  input.sort.bam --minMappingQuality  30  --region 1 --labels  H3K9me3 H3k27me3 H3K4me3 H3K4me1 input  -out readCounts.npz  --outRawCounts  readCounts.tab

· 參數(shù)講解:

· bins 代表按照bin 劃分基因組,默認(rèn)10k為一個(gè)窗口

· --bamfiles 一系列已經(jīng)sort過(guò)的bam文件

· --minMappingQuality 比對(duì)質(zhì)量閾值

· --region 基因組的區(qū)域默認(rèn)none 可以寫(xiě)成 1,chr1,chr1:456700:891000的形式

· --labels 標(biāo)簽

· -out 輸出bin的readscount 矩陣,(npz 為numpy 存儲(chǔ)的文件)

· --outRawCounts 同上,為tab分割的文本文件

· plotCorrelation

· 原理:

· 針對(duì)multiBamSummary 產(chǎn)生的矩陣,利用pearson 或者spearman 計(jì)算樣本間的相關(guān)性

· 用法:

· plotCorrelation  -in  readCounts.npz –corMethod  spearman --skipZeros  --plotTitle  'Spearman Correlation of Read Counts' --whatToPlot  heatmap  --colorMap  PuRd –plotNumbers  -o  heatmap_SpearmanCorr_readCounts.png  --outFileCorMatrix  SpearmanCorr_readCounts.tab

· 參數(shù)講解:

· -in 輸入 ,文件為 multiBamSummary 產(chǎn)生的矩陣

· --corMethod 相關(guān)性分析的方法:pearson 或者spearman

· --colorMap 選取色系

· -o 圖像輸出路徑:

· 結(jié)果展示

此圖非常直觀的展示了各個(gè)組蛋白之間的相關(guān)性

· 計(jì)算TSS 區(qū)域內(nèi)的富集程度

·  computeMatrix

· 對(duì)基因區(qū)域以及上下游劃bin,計(jì)算每個(gè)bin內(nèi)Chip的信號(hào)強(qiáng)度

· 用法:

· computeMatrix   scale-regions -S  G_K4me3_1.bw    G_K27ac_1.bw  G_K4ME1_1.bw  G_K27me3   D_K4me3_1.bw    D_K27ac_1.bw  D_K4ME1_1.bw  D_K27me3  -R  up.Gene.bed   down.Gene.bed –beforeRegionStartLength  5000  --regionBodyLength  5000 –afterRegionStartLength  5000 --skipZeros  -o matrix.mat.gz

· 參數(shù)講解:

· -S score file bigwig文件

· -R 參考基因組 bed文件,如果有多個(gè)bed的文件 以空格分開(kāi)

· --beforeRegionStartLength 基因上游長(zhǎng)度

· --regionBodyLength 基因body

· --afterRegionStartLength 基因下游長(zhǎng)度

· plotHeatmap

· 基因的ChIP的信號(hào)強(qiáng)度按照基因上下游所有bin的信號(hào)強(qiáng)度的均值進(jìn)行排序并通過(guò)熱圖進(jìn)行展示

· 用法:

·  plotHeatmap -m matrix.mat.gz  -out compare_heatmap.png

· 參數(shù)講解:

· -m computeMatrix 步驟所產(chǎn)生的矩陣

· -o 輸出文件

· 結(jié)果展示:

轉(zhuǎn)錄因子的DNA結(jié)合強(qiáng)度信號(hào)強(qiáng)度從高到低排列,同時(shí)畫(huà)出其他調(diào)控因子或組蛋白修飾結(jié)合信號(hào)。有助于我們從全基因組角度,了解轉(zhuǎn)錄因子或組蛋白修飾之間的關(guān)系

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多