差異分析系列推文在: 不過,標(biāo)準(zhǔn)分析通常是不夠的,定位到成百上千個有統(tǒng)計學(xué)顯著變化的差異表達(dá)基因后,同樣是有成百上千個生物學(xué)功能注釋(GO功能和KEGG通路),普通的超幾何分布檢驗(yàn)已經(jīng)不能滿足大家多元化的分析了,所以就有了大家耳熟能詳?shù)腉SEA分析,以及絕大部分人比較陌生的GSVA分析。 GSVA分析的文章發(fā)表于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同樣是broad 研究生出品,其在2005年P(guān)NAS發(fā)表的gsea已經(jīng)高達(dá)1.4萬的引用了,不過這個GSVA才不到300。去年我就介紹過一波它的分析流程,在:使用GSVA方法計算某基因集在各個樣本的表現(xiàn) 非常簡單的代碼,所以各個培訓(xùn)機(jī)構(gòu),公司人員都開始學(xué)習(xí)和二次創(chuàng)作進(jìn)而分享??紤]到最近郵箱接收的GSVA提問比較多,我這里還是得再次歸納總結(jié)一波,這次我準(zhǔn)備從GSVA其實(shí)就是pathway級別的差異分析的角度來分享。 一般人做數(shù)據(jù)挖掘,到差異基因的生物學(xué)功能注釋(GO功能和KEGG通路)就結(jié)束了,進(jìn)而也就是去使用一些網(wǎng)頁工具,比如string,出一些花花綠綠的圖表,比如PPI網(wǎng)絡(luò)圖。實(shí)際上,使用了GSVA,可以把成百上千個生物學(xué)功能注釋(GO功能和KEGG通路)轉(zhuǎn)換為新的表達(dá)矩陣,就是具體的每個通路在各個樣本的基因集變異分析(Gene Set Variation Analysis,GSVA)值,我們把它當(dāng)作一般的矩陣文件,進(jìn)行差異表達(dá)分析,熱圖繪制,火山圖繪制。 下面我們以文獻(xiàn) Metabolic remodeling contributes towards an immune‐suppressive phenotype in glioblastoma 為例,欣賞它的兩個圖表,文章發(fā)表在Cancer Immunology, Immunotherapy (2019) https:///10.1007/s00262-019-02347-3 基于pathway的熱圖雖然作者這里使用的代謝組學(xué)數(shù)據(jù):
本質(zhì)上仍然是記錄表達(dá)量。 基于pathway的火山圖pathway的具體含義pathway在我這里是其實(shí)想指代基因集的別名,其中msigdb有著豐富的基因集,MSigDB(Molecular Signatures Database)數(shù)據(jù)庫中定義了已知的基因集合:http://software./gsea/msigdb 包括H和C1-C7八個系列(Collection),每個系列分別是:
|
|
|