|
、 火山圖是大家在閱讀文獻時經(jīng)??吹降膱D,主要用于展示基因的差異表達,在前期篩選課題的時候常用,且常與熱圖搭配出現(xiàn)。因為繪制出來的差異表達的基因形如火山,故得名火山圖。 火山圖主要用于展示顯著差異表達的基因。通常對顯著的定義是:p0.05且兩組表型的基因表達差異/Fold Change在兩倍以上,即FC>=2。但在文獻中我們常見的火山圖橫縱坐標分別是log2FC與-log10Pvalue。以2為底數(shù),取基因表達變化的對數(shù)值為橫坐標使得結果更容易讀懂:比如,某基因在實驗組中的表達是對照組中的4倍,log24=2,若基因在實驗組中的表達是對照組的2倍,log22=1。在火山圖中,橫坐標每增加一個單位,則說明基因在兩組表型中呈兩倍的差異,。在火山圖中取10為底數(shù)p值的負對數(shù)為縱坐標主要兩個考慮:一,可以使得縱坐標的刻度更合理,因為p值間的差異可能非常大,可以取值正無窮小到1之間;二,對數(shù)處理后的原p值越小對應的縱坐標值越大,即越顯著。 火山圖的本質(zhì)是散點圖,理論上可以畫散點圖的工具都可以用來畫火山圖。比如在線網(wǎng)站NetworkAnalyst,SangerBox里面的火山圖繪制工具都可以做火山圖。工具雖然方便但是自己可操作的空間少了,本文先向大家介紹人人都可以快速掌握的excel繪制火山圖的方法。 數(shù)據(jù): 65例病人的正常組織與對應的直腸癌中的基因表達數(shù)據(jù)(GEO accession: GSE20842) Excel繪制火山圖主要分為以下幾個步驟: 打開下載的原始數(shù)據(jù)集,選中表格中P.Value,logFC兩列復制到新的excel1中(原始數(shù)據(jù)中l(wèi)ogFC即默認的底數(shù)為2,即log2FC) 在新的表格中C2單元格中輸入=-LOG10(A2) 后Enter鍵,得到單元格結果。再點雙擊擊單元格右下角則會以同樣的函數(shù)生成這一列相應的值 從數(shù)據(jù)中篩選出p<=0.05且|log2fc|>=2的數(shù)據(jù)到新列(E,F(xiàn),G)中得到如下excel1表格(自此我們得到了繪制火山圖所需要完整的數(shù)據(jù),excel1中A,B,C三列為原始數(shù)據(jù)中p ,log2FC及對應的-log10(P.Value)值。E,F(xiàn),G則為篩選后的數(shù)據(jù)值) 依次選中B/C兩列-插入-圖標散點圖,生成火山圖 自定義火山圖參數(shù)更改圖表樣式 選中圖片-圖表工具-設計-圖表樣式(自由搭配滿意的圖片樣式) 在生成火山圖后,我們需要從所有數(shù)據(jù)中篩選出差異表達的基因,即篩選出p<=0.05且|log2fc|>=2的數(shù)據(jù) 單擊選中圖標數(shù)據(jù)任意一個數(shù)據(jù)點-右鍵選擇“選擇數(shù)據(jù)”-“添加” 在添加的數(shù)據(jù)系列中填寫合適的系列名稱與橫縱坐標軸值(此處系列名稱我們填 p<>,即我們之前篩選出來的E,G,F(xiàn)三列數(shù)據(jù);X,Y軸填寫數(shù)據(jù)對應的單元格范圍,此處我們都是2:500)。自此,我們就在火山圖中標記出了我們感興趣的差異表達的基因。 我們可以為火山圖加坐標軸標題,圖例,圖表標題,數(shù)據(jù)標簽等元素 ![]() 單機選中圖表中任意一個數(shù)據(jù)-右鍵選擇“設置數(shù)據(jù)系列格式” 通過此菜單欄,可以自定義圖表中的任一元素參數(shù) ![]() 選中你感興趣的數(shù)據(jù)點-右鍵選擇“添加數(shù)據(jù)標簽”,顯示該數(shù)據(jù)對應的值,然后在原始數(shù)據(jù)中匹配相應的genesymbol添加就好啦(同時可以在設置數(shù)據(jù)系列格式中自定義參數(shù)) ![]() 本文我們向大家演示如何通過excel繪制自己滿意的火山圖。Excel繪制火山圖主要分為數(shù)據(jù)的處理(篩選你感興趣的數(shù)據(jù)到新列),選擇數(shù)據(jù)并作標記,添加圖表元素(坐標軸與標題名,圖例等參數(shù)),修改元素參數(shù),添加數(shù)據(jù)標簽(可以添加對應的gene symbol)等內(nèi)容。Excel操作簡單普遍,相信大家都可以繪制自己滿意的火山圖?。ㄈ粝肜L制更美觀的火山圖,請關注下周推文:用R語言繪制火山圖) |
|
|