| 淺談Deeptools—生信之深海利器https://www./figure/Examples-of-images-created-with-deepTools-A-Overview-of-the-deepTools-workflow-that_fig2_262076117 2. 歷年高分文章中的Deeptools美圖: Embryonic transcription is controlled by maternally defined chromatin state Two independent modes of chromatin organization revealed by cohesin removal The pioneer factor OCT4 requires the chromatin remodeller BRG1 to support gene regulatory element function in mouse embryonic stem cells computeGCBias 用Benjamini’s 的方法計(jì)算GC-bias 并進(jìn)行可視化展示,如下圖所示: 知道了DeepTools的滿(mǎn)腹才華,如何才能發(fā)揮DeepTools的作用呢?在此,小編想要細(xì)致的介紹兩個(gè)模塊的使用,以來(lái)給大家舉個(gè)”栗子”: · Correlation between BAM files (計(jì)算bam文件相關(guān)性) · multiBamSummary · 原理: · 將基因組劃bin,通過(guò)bam文件計(jì)算每個(gè)bin reads的覆蓋度(Coverage) · 用法: · multiBamSummary bins --bamfiles H3K9me3.sort.bam H3k27me3.sort.bam H3K4me3.sort.bam H3K4me1.sort.bam input.sort.bam --minMappingQuality 30 --region 1 --labels H3K9me3 H3k27me3 H3K4me3 H3K4me1 input -out readCounts.npz --outRawCounts readCounts.tab · 參數(shù)講解: · bins 代表按照bin 劃分基因組,默認(rèn)10k為一個(gè)窗口 · --bamfiles 一系列已經(jīng)sort過(guò)的bam文件 · --minMappingQuality 比對(duì)質(zhì)量閾值 · --region 基因組的區(qū)域默認(rèn)none 可以寫(xiě)成 1,chr1,chr1:456700:891000的形式 · --labels 標(biāo)簽 · -out 輸出bin的readscount 矩陣,(npz 為numpy 存儲(chǔ)的文件) · --outRawCounts 同上,為tab分割的文本文件 · plotCorrelation · 原理: · 針對(duì)multiBamSummary 產(chǎn)生的矩陣,利用pearson 或者spearman 計(jì)算樣本間的相關(guān)性 · 用法: · plotCorrelation -in readCounts.npz –corMethod spearman --skipZeros --plotTitle 'Spearman Correlation of Read Counts' --whatToPlot heatmap --colorMap PuRd –plotNumbers -o heatmap_SpearmanCorr_readCounts.png --outFileCorMatrix SpearmanCorr_readCounts.tab · 參數(shù)講解: · -in 輸入 ,文件為 multiBamSummary 產(chǎn)生的矩陣 · --corMethod 相關(guān)性分析的方法:pearson 或者spearman · --colorMap 選取色系 · -o 圖像輸出路徑: · 結(jié)果展示 此圖非常直觀的展示了各個(gè)組蛋白之間的相關(guān)性 · 計(jì)算TSS 區(qū)域內(nèi)的富集程度 · computeMatrix · 對(duì)基因區(qū)域以及上下游劃bin,計(jì)算每個(gè)bin內(nèi)Chip的信號(hào)強(qiáng)度 · 用法: · computeMatrix scale-regions -S G_K4me3_1.bw G_K27ac_1.bw G_K4ME1_1.bw G_K27me3 D_K4me3_1.bw D_K27ac_1.bw D_K4ME1_1.bw D_K27me3 -R up.Gene.bed down.Gene.bed –beforeRegionStartLength 5000 --regionBodyLength 5000 –afterRegionStartLength 5000 --skipZeros -o matrix.mat.gz · 參數(shù)講解: · -S score file bigwig文件 · -R 參考基因組 bed文件,如果有多個(gè)bed的文件 以空格分開(kāi) · --beforeRegionStartLength 基因上游長(zhǎng)度 · --regionBodyLength 基因body · --afterRegionStartLength 基因下游長(zhǎng)度 · plotHeatmap · 基因的ChIP的信號(hào)強(qiáng)度按照基因上下游所有bin的信號(hào)強(qiáng)度的均值進(jìn)行排序并通過(guò)熱圖進(jìn)行展示 · 用法: · plotHeatmap -m matrix.mat.gz -out compare_heatmap.png · 參數(shù)講解: · -m computeMatrix 步驟所產(chǎn)生的矩陣 · -o 輸出文件 · 結(jié)果展示: 
 | 
|  | 
來(lái)自: 生物_醫(yī)藥_科研 > 《待分類(lèi)》