摘要:cBioPortal提供了這樣一種網(wǎng)絡(luò)資源:探索,可視化和分析多維度癌癥基因組數(shù)據(jù)。這個門戶網(wǎng)站把癌組織和細(xì)胞系還原成分子表達譜數(shù)據(jù),再到可以理解的遺傳的(基因的),表觀遺傳的,gene expression和蛋白events。查詢交互界面整合用戶的數(shù)據(jù)可以使研究者交互探索不同samples,genes,pathways的遺傳學(xué)上的改變,假如暗含的數(shù)據(jù)可行,還可以聯(lián)系到臨床結(jié)果。這個網(wǎng)站還提供gene水平的圖形總結(jié),從多平臺,網(wǎng)絡(luò)可視化分析,生存分析,病人為中心的查詢,和軟件編程入口。直觀的網(wǎng)站交互界面使得復(fù)雜的癌癥基因組profiles對沒有生物信息學(xué)專業(yè)只是的研究者和臨床工作者可行,這樣就促進了生物學(xué)發(fā)現(xiàn)。這里,我們提供一個可操作的guide來分析和可視化cBioPortal的特征(對癌癥基因集的)。Introduction大規(guī)模的癌癥基因組計劃,比如The cancer genome atlas(TCGA) and the International cancer genome consortium(ICGC),正在從多技術(shù)平臺產(chǎn)生更多的癌癥基因組數(shù)據(jù)。這使得這些數(shù)據(jù)的整合,探索和分析越來越具有挑戰(zhàn)性,尤其是對于沒有計算機背景知識的科學(xué)家來說。cBioPortal是專門設(shè)計來降低對這些復(fù)雜數(shù)據(jù)的接近門檻,因此,促進基因組數(shù)據(jù)向新的生物學(xué)視野,治療和臨床特征的轉(zhuǎn)變。 這個網(wǎng)站,促進多維度癌癥基因集數(shù)據(jù)的探索,可以允許跨gene,樣本和數(shù)據(jù)類型的可視化分析。用戶可以可視化一個癌癥研究中多樣本間基因改變的模式,并比較點多癌癥研究中g(shù)ene改變頻率,或者在一個個體腫瘤樣本中總結(jié)概括所有的相關(guān)的基因組改變。這個網(wǎng)站也支持生物通路探索,生存分析,基因改變間的相互獨特性分析,可選擇性的數(shù)據(jù)下載,編程接口和可以用于發(fā)表的可視化總結(jié)。 整合進cBioPortal的基因組數(shù)據(jù)類型包括體細(xì)胞突變,DNA copy-number alterations(CNAs),Mrna和microRNA(miRNA)表達,DNA甲基化,蛋白質(zhì)富集,磷酸化蛋白富集。目前,網(wǎng)站包含從10個出版的癌癥研究的數(shù)據(jù)集,包括癌癥細(xì)胞系百科全書,多于20個研究在TCGA流程。對沒有一個腫瘤樣本,數(shù)據(jù)是可以從多基因組數(shù)據(jù)分析平臺可獲取的。網(wǎng)站的簡化概念是在基因水平整合多種數(shù)據(jù)類型,然后詢問每個sample中專門的生物學(xué)事件的呈現(xiàn)(例如,基因突變,基因純和刪除,基因擴增,上調(diào)或下調(diào)的mRNA或miRNA),蛋白的上下調(diào)等。這使得用戶可以查詢每個gene和每個樣本的的遺傳學(xué)改變,并檢驗復(fù)發(fā)(某些特殊癌癥)。 需要的設(shè)備個人計算機,可以聯(lián)網(wǎng),已經(jīng)安裝java 注意:一下瀏覽器已經(jīng)被實驗可行,google chrome,firefox,safari,ie9.0 需要安裝adobe flash player http://get.adobe.com/flashplayer/ Java 可以下載http://www./getjava/ Adobe pdf 閱讀器http://get.adobe.com/reader/ Vector graphic editor 這個可以可視化和編輯在cBioPortal下載的SVG file(OncoPrints)。支持這種軟件的是Adobe Illustrator (http://www.adobe.com/products/illustrator.html) and Inkscape (http:///) 說明cBioPortal的基因datasets可以獲取或下載,通過使用交互web 界面,也可以通過程序下載。 用戶可以選擇查詢單一癌癥研究或across癌癥研究。也可以查看個體癌癥樣本的相關(guān)的基因改變。 查詢個人癌癥研究在單一癌癥查詢中,用戶可以探索,可視化,選擇的gene中的基因改變,包括所有選擇的samples中的這些gene的改變之間的關(guān)系,和同一個gene 在不同數(shù)據(jù)類型之間的關(guān)系。執(zhí)行單個癌癥研究的查詢需要四步,見下圖1??傮w過程和特殊的查詢都在下面顯示了。 用戶可以從超過165個cancer studies進行選擇(這里文章剛發(fā)表的時候是25個研究,可見網(wǎng)站發(fā)展只迅速)。 ![]() figure 1.jpg 這一項的選擇和之前也有變化,上面劃勾的兩個是默認(rèn),一個是突變,一個是推斷的gene copy數(shù)變異。當(dāng)可選的時候,相關(guān)的mRNA或miRNA表達或相關(guān)的蛋白和磷酸化蛋白富集數(shù)據(jù)也可以被選擇。蛋白和磷酸化蛋白數(shù)據(jù)基于的是reverse phase protein array(RPPA)實驗。對于mRNA或miRNA數(shù)據(jù)和蛋白,磷酸化蛋白數(shù)據(jù),z 分?jǐn)?shù)是從表達值預(yù)先計算。用戶可以自定義閾值或使用默認(rèn)值(偏離均值2 SDs)。mRNA的z分?jǐn)?shù)由每個sample決定,是通過比較一個gene的Mrna表達值相對參考population中的分布(可以代表這個gene的典型分布)。如果正常的臨近組織中的表達數(shù)據(jù)可以獲得,這些數(shù)據(jù)就會被用來作為reference population。否則,所有腫瘤的表達值二倍于這個gene的被使用。miRNA表達譜或蛋白豐度的z分?jǐn)?shù)由每個sample決定,通過比較各自的所有樣本的miRNA或蛋白數(shù)據(jù)。 ![]() figure 2.jpg 定義上面這個case sets分析的時候,缺省選擇是match選擇的基因表達譜。例如,有sequencing data 的cases會被選擇,假如只查詢突變的話。然而,用戶可以通過下拉菜單改變這個選擇,這個單是有可獲得的數(shù)據(jù)定義的(例如,tumors with mutations,CAN data,gene expression,RPPA data)或由已知的腫瘤亞型決定。用戶可以輸入感興趣的特殊的cases,通過選擇“user-defined case list”或建立一個用戶定義的case set基于臨床特征,這個在“build case set”對話中。 ![]() FIgure 3.jpg 當(dāng)輸入gene sets分析的時候,用戶可以手工輸入HUGO gene symbols,Entrez gene ids,gene aliase或從預(yù)先定義的自己感興趣的gene sets或pathways中選擇。如果對一個給定的cancer 研究,循環(huán)的gene列表可以獲得,例如,在mutsig中的不斷改變的突變genes或GSITIC中不斷改變的突變genes,那么用戶也可以從這些列表中選擇genes,當(dāng)然也可以使用這些列表構(gòu)建gene sets或從這寫列表中手動添加genes。 ![]() FIgure 4.jpg Fig. 1. Performing a query of a single cancer study The four steps to query genomic data in the cBioPortal for Cancer Genomics for a single cancer study. The query page is accessed from the site's home page. All queries must include at least one gene. The query shown is the one used to generate the results shown in Figs. 2and 3. 查看和結(jié)果解讀下面是我自己的結(jié)果。Liver cancer 所用gene是投稿的五個gene ![]() 5.jpg 下面這個是原文中的圖 ![]() 6.jpg Fig. 2. The OncoPrint tab The example shows a visual summary of the different mechanisms of RB pathway alteration across a set of glioblastoma samples based on a query of the three genes CDKN2A, CDK4,and RB1. The OncoPrint tab summarizes genomic alterations in all queried genes across a sample set. Each row represents a gene, and each column represents a tumor sample. Red bars indicate gene amplifications, blue bars are homozygous deletions, and green squares are 第一個面板oncoprint行代表gene,列代表samples。圖標(biāo)和顏色代表代表不同的基因型改變,包括突變,CNAs(amplifications擴增,homozygous deletions純合子缺失),基因或蛋白豐度改變。把鼠標(biāo)放到每一個小標(biāo)志上,可以看到關(guān)于caseID(代表一個病人sample或cell line)等的詳細(xì)信息,點擊樣本號可以進入該sample的詳細(xì)信息,包括年齡性別還有g(shù)ene等詳細(xì)情況。對于突變evens,這顯示了氨基酸的改變。默認(rèn)情況下,cases按alterations進行排序。用戶可以重新排序,比如字母,caseID,等。用戶也可以選擇移除未改變的cases從可視化圖中。通過可視化一系列cases中的gene改變,oncoprints可以幫助鑒定比如gene sets中的相斥或共發(fā)生事件。 上面這個例子中,這三個genesCDKN2A,CDK4,RB1,。65cases(71%)在這三個genes中至少有一個發(fā)生了改變。每個gene的突變頻率都顯示出來了。對于CDKN2A來說,大多數(shù)的改變是純合子缺失,CDK4是擴增。RB1相關(guān)的包括1個純合子缺失和mutations。這三個gene的改變在samples中的分布幾乎是相互排斥的狀態(tài),這可以進行統(tǒng)計學(xué)分析和用mutual exclusivity tab進行可視化。后面會解釋這個面板。 -1.一旦submit按鈕按下,oncoprint結(jié)果會自動顯示。 -2.如果genes不適合window,會有水平滑動條。 -3.為了讓oncoprint更緊湊,有三個選擇可以進行自定義,(i)使用zoon bar進行尺度縮小放大(ii)通過選擇view下去反選“show unaltered cases”移除沒有改變的cases(iii)反選view下的show whitespace between columns移除samples之間的gaps。如下圖 ![]() 7.jpg -4. 在sort中改變顯示順序5 ![]() 8.jpg -5.可以輸出oncoprint,選擇下載成xml文件,in scalable vector graphic(SVG)格式 ![]() 9.jpg -6.若要獲得額外的詳細(xì)信息,那就動下你的鼠標(biāo)到小標(biāo)志上面吧。 -7.如果想修正或開始查詢,選擇結(jié)果面板上的“modify query” 第二個面板Mutual exclusivity下面這是新版查詢結(jié)果(2017.10.03) ![]() 10.jpg 下面是原始文章中的 ![]() 11.jpg Fig. 3. The Mutual Exclusivity tab The example shows that genes that alter RB signaling in glioblastoma have a tendency toward mutual exclusivity. This tab provides summary statistics on mutual exclusivity and co-occurrence of genomic alterations in each pair of query genes. In this example, all three pairs have a tendency toward mutual exclusivity. Although the CDK4-RB1 pair has the strongest tendency toward mutual exclusivity (dark blue background), the relationship is not statistically significant (P = 0.11). The mutual exclusivity is significant for the other two gene pairs (P < 0.05, red outline). The P values are determined by a Fisher's exact test with the null hypothesis that the frequency of occurrence of a pair of alterations in two genes is proportional to their uncorrelated occurrence in each gene. 癌癥中的生理過程或pathways經(jīng)常通過不同的genes或多個不同的機制從而失調(diào)。Mutual exclusivity(互斥)的概念可以用了鑒定預(yù)先不知道的機制,而這個機制可能助于癌癥發(fā)生和癌癥進展。在互斥中,和某一特殊癌癥相關(guān)的genes傾向于在一系列癌癥中互斥。也就是說,每一種tumor很可能只有一種genetic events。相反的狀態(tài)(co-occurrence)是,同一個癌癥sample中,genetic 改變發(fā)生在很多genes中。我們的網(wǎng)站計算一系列簡單的統(tǒng)計學(xué)來鑒定互斥或共發(fā)生的模式。對于每對查詢的gene(G1和G2),portal計算一個odds ratio(比值比),這個比值比揭示這兩個genes在選擇的cases中是相互排斥還是共發(fā)生。公式如下: ![]() 0.jpg A代表兩個genes都發(fā)生改變的cases數(shù)目 B代表G1改變G2沒變的cases數(shù)目 C代表G2改變G1沒變的cases數(shù)目 D代表兩者都沒發(fā)生改變的cases數(shù)目 然后把每一對genes指派到五個范疇中的一個,預(yù)示互斥或共表達,或沒聯(lián)系。分析的說明已經(jīng)提供了。為了鑒定每對gene pair的關(guān)系的重要性,網(wǎng)站執(zhí)行費希爾精確檢驗。 使用的查詢參數(shù)和oncoprints中描述的一樣。互斥分析顯示了選擇的三個gene傾向于互斥的方式存在,但是這種模式只對CDKN2A和CDK4,CDKN2A和RB1合適,對CDK4和RB1不合適,這可能是因為樣本小。這適合GBM中RB信號通路的解釋。RB信號通路可以,通過RB1本身的去激活(通過圖表或純合子缺失)而導(dǎo)致RB信號通路失活,通過擴增激活CDK4(這個CDK可以一直RB1活性),或通過CDK抑制劑p16的去激活(缺失或突變),而這個抑制劑有CDKN2A編碼。這樣,這些genes中的單個gene的改變足夠讓RBpathway失活,這就是互斥分析所展示的。 第三個面板plotscBioPortal提供了集中不同的ways來可視化discrete genetic events(CNAa或突變),和連續(xù)的events,比如關(guān)于mRNA或蛋白豐度的data,或DNA甲基化數(shù)據(jù)。 對于query中定義的單個gene,portal可以產(chǎn)生不同的plots,依賴于數(shù)據(jù)的可獲得性。 mRNA vs copy-number選項展示了box-and-whisker plot來顯示mRNA表達,數(shù)據(jù)來源與用戶選擇的每個樣本的數(shù)據(jù)源??截悢?shù)狀態(tài)可以純合子刪除,雜合子刪除,二倍體,gained(意味著相對少copies的擴增事件),擴增(意味這很多拷貝的擴增事件)。Mrna vs DNA 甲基化選項展示了mRNA表達譜相對于所有選擇的samples的DNA甲基化的散點圖。甲基化貝塔值用來評估CpG locus的甲基化水平,使用的是密度比率,在甲基化和未甲基化位點之間的。RPPA蛋白水平vs mRNA選項顯示的是某個gene的蛋白豐度和mRNA豐度的比較(所有選擇的samples中)。 Genes和data types選項(現(xiàn)在在左側(cè))通過下拉菜單選擇,并且只有適合當(dāng)前數(shù)據(jù)的類型才會出現(xiàn)。所有的plots可以作為PDF輸出用于出版。 下面這個例子中用的是顯示查詢選項ERBB2的分析,這是一個在colon和rectum中已知的促癌gene,編碼的是表皮生長因子受體。 ![]() 12.jpg The example shows ERBB2 mRNA expression is increased in samples with DNA amplification, and ERBB2 protein abundance is higher in samples with increased mRNA. (A) A plot showing the relationship between ERBB2 mRNA abundance and CNA in the ERBB2 gene in tumors from the selected cancer study. The “x”s indicate individual tumors, and the circles indicate tumors with missense mutations. (B) A plot showing the relationship between the abudance of the ERBB2 protein and mRNA in samples from the selected cancer study. Homdel, homozygously deleted; Hetloss, heterozygously deleted; Diploid, two alleles present; Gain, low-level gene amplification event; Amp, high-level gene amplification event; Mutated, nonsynonymous mutation; Normal, no mutation or CNA present. ERBB2在colorectal癌癥samples中amplified。上圖結(jié)果顯示,ERBB2 mRNA在ERBB2擴增的samples中是增加的fig4A。并且,mRNA最高的ERBB2tumors有最高數(shù)量的ERBB2蛋白豐度(Fig.4B)。 具體步驟如下-1.執(zhí)行Fig4中的條件,submit -2.選擇plots 面板 -3.在第一個Data type菜單選擇“Mrna expression(microarray)” 改進:在horizontal axis中的profile type中選copy number Profile name選擇putative copy-number alternation from GSITIC -4.第二個data type 菜單選擇“putative copy-number alternations from GISTIC” 改進:在vertical axis中,profile type選Mrna Profile name 選相應(yīng)的即可 -5.在plot type menu中選擇“Mrna v copy number” 改進:沒有這一項了,圖可以自動生成 -6.按下箭頭可以產(chǎn)生fig4A 改進:箭頭可以改變橫縱坐標(biāo) -7.可以輸出為PDF格式 -8.plot type 菜單可以選擇“RPPA protein level v. mRNA” 改進:這個沒有了,都在profile type里 -9.按arrow按鈕可以產(chǎn)生Fig.4B 注意:如果組合不能被plot被選擇,會有錯誤信息。 改進:現(xiàn)在不能組合,單獨生成 第四個面板mutations突變這個面板提供兩個細(xì)節(jié),一個是圖形總結(jié)一個是用戶可自定義修改的table,這都是關(guān)于每個query gene條件下鑒定的所有的all nonsynonymous mutations.圖形展示的是在pfam 蛋白域(由經(jīng)典的基因isoform編碼)的context中所有的的位置和頻率。所有的DNA突變被標(biāo)準(zhǔn)化到canonical RefSeq isoform(using Oncotator, http://www./oncotator/)。當(dāng)一個DNA 突變僅影響到非經(jīng)典isoforms,這個圖表就不被包括在圖形中。將來的版本將提供一個專門的表格來記錄這種信息。 圖的下面是所有非同突變的表。這個table,可以進行分類和篩選,如果data可以獲取,那有下面信息會被提供:每個sample的caseID(可以超鏈接到病人view page,包含突變信息);氨基酸改變,突變的類型(missense錯義突變,nonsense無義突變,splice site剪切位點,frameshift insertion or deletion框移插入或缺失,in-frame insertion or deletion框內(nèi)插入或缺失,不終止nonstop,不開始nonstart).COMIC(Catalogue of somatic mutations in cancer)中這個位置的突變數(shù)目。錯義突變的預(yù)測的功能改變(可以超鏈接到mutation assessor),link到3D結(jié)構(gòu)帶有突變高亮(超鏈接到mutation assessor),突變狀態(tài)(體細(xì)胞或生殖細(xì)胞-生殖細(xì)胞圖表目前只提供某些研究中BRCA1和BRCA2),已經(jīng)證實的狀態(tài)(有效或未知),sample被sequenced和突變鑒定的序列中心,這種tumor中突變的等位基因頻率,匹配的normal sample中突變的等位基因頻率,確切的基因組位置(染色體,start,end,reference allele,variant allele),突變的和參考的等位基因reads(在tumor和normal sample的sequencing 結(jié)果中發(fā)現(xiàn)的突變和reference alleles的數(shù)目),受影響的isoform的信息。最后這三個默認(rèn)不顯示,但可以設(shè)置顯示。用戶可以perform 搜表中的任何text。 ![]() 13.jpg Fig. 5. The Mutations tab To generate these results, the query was limited to mutations for ERBB2 in the indicated cancer study. Four of the 10 ERBB2 mutations in colorectal cancer occur in a hotspot in the kinase domain. (A) The graphical view shows the Pfam protein domains and the positions of specific mutations. The length of the line connecting the mutation annotation to the protein is indicative of the number of samples that have the mutation. The most recurrent mutations are labeled in the graphical view. (B) The tabular view provides additional information about all mutations in each query gene. 實例中展示的ERBB2的分析,用的是colon和rectum adenocarcinoma only sequenced tumors。這個圖顯示,在colorectal 癌癥samples中,有10個ERBB2非同義突變,其中四個是V842I在kinase domain,這顯示了這是一個蛋白激活熱點。從這個表中,激酶domain圖表在氨基酸755,777,和842已經(jīng)在幾種其他癌癥studies中被觀測到。(看氨基酸位點可以鼠標(biāo)放圖上) ![]() 14.jpg 具體步驟如下 -1,執(zhí)行Fig.5的搜索條件 -2.選擇mutation tab -3.鼠標(biāo)劃過代表蛋白domains的顏色區(qū)域,view關(guān)于這個domain的細(xì)節(jié)和他的開始和結(jié)束氨基酸殘基(這個蛋白質(zhì)sequence) -4.鼠標(biāo)劃過蛋白序列圖上的圓圈就是那個綠點,看具體的突變信息。連接circle到蛋白的線的高度顯示了突變的頻率。突變頻率最高的以他的氨基酸改標(biāo)注,例如那個v842I. -5.通過使用“columns”可以自定義table中的顯示,選擇想顯示的,反選hide的。 -6.使用上下箭頭可以對data進行排序(根據(jù)column值) -7.follow caseID超鏈接,可以得到關(guān)于tumor sample的細(xì)節(jié)(包含突變信息) -8.使用瀏覽器后退按鈕可以回到mutations tab。 -9.鼠標(biāo)劃過cosmic列的值,可以得到這個殘基的突變頻率和個體信息 -10.鼠標(biāo)劃過FIS列的值,追隨超鏈接到mutation assessor或mutiple sequence alignment。 -11.點擊3D 可以鏈接到3D蛋白結(jié)構(gòu),突變的氨基酸高亮顯示,使用瀏覽器back可以回到mutation tab。 -12.搜索框內(nèi)輸入“V842I”(沒有引號),可以僅顯示V842I突變。 -13.若想再次全部展示,把12搜索框中輸入的刪除即可。 第五個面板 protein changes蛋白質(zhì)和磷酸化蛋白data在protein changes tab可以獲得。來自RPPA平臺的大規(guī)模蛋白組數(shù)據(jù)有12個TCGA cancer studies在網(wǎng)站可以獲得(table s1)。如之前描述的,對于查詢gene的蛋白質(zhì)豐度對mRNA的散點圖可以生成,前提是這兩種數(shù)據(jù)都有(Fig.4B,Plots tab)。 對每一個查詢來說,網(wǎng)站也會為所有可獲取的RPPA蛋白數(shù)據(jù)執(zhí)行不同的分析,并鑒定和查詢的gene有關(guān)的發(fā)生遺傳學(xué)改變的蛋白和磷酸化蛋白。 在查血screen不一定非要選擇“RPPA protein/phosphoprotein level”。如果數(shù)據(jù)可以獲得,那么,這個分析可以被執(zhí)行。對可獲得蛋白和磷酸化蛋白,cBioPortal執(zhí)行一個雙側(cè),雙樣本學(xué)生t檢驗來鑒定tumor samples(查詢的gene中至少有一個有alternation)之間的蛋白豐度差異。結(jié)果以一列蛋白和磷酸化蛋白list展示,根據(jù)在altered和未altered samples中間的蛋白豐度差異進行排序。這個table包含下列信息: 抗體可以識別的靶蛋白;磷酸化或修飾的殘基(比如,切割);腫瘤中發(fā)生改變的平均蛋白豐度z分?jǐn)?shù);p值;可選擇是否畫出結(jié)果圖,這個默認(rèn)顯示。RPPA ID和未改變和改變的樣本間的平均z分?jǐn)?shù)之間的絕對差異是可選擇列。對每一個蛋白或磷酸化蛋白,改變和未改變的samples之間的RRPA數(shù)據(jù)的z分?jǐn)?shù)可以box圖展示。 下面這個結(jié)果展示的是,和glioblastoma cancer 突變和copy 數(shù)目有關(guān)的腫瘤抑制和脂質(zhì)磷酸化蛋白,由PTEN編碼。Fig.6。例如,glioblastoma cancer中PTEN 缺失(突變或copy number deletion),和AKT(pT308和Ps473)的磷酸化緊密聯(lián)系在一起。Fig.6。 步驟如下 1.如下圖Fig.6所示的條件,perform 2.選擇protein changes tab(這里不出現(xiàn)這個面板,不知道是改進還是) 3.使用antibody type的下拉菜單,來限定使用抗體收集的數(shù)據(jù),來檢測所有的蛋白或磷酸化蛋白 4.自定義table中顯示的data,使用show/hide columns菜單。選擇和反選。 5.press plot中的+ 符號展示盒裝圖,比較samples之間的z分?jǐn)?shù)和豐度,有差異的沒差異的(查詢的gene或多個gene) 6.輸入ERBB(沒有引號)在搜索框,展示ERBB2和ERBB3的磷酸化改變。 7.刪除搜索文字可以返回完整結(jié)果。 ![]() 15.jpg Fig. 6. The Protein Changes tab When available in the cancer study selected, results related to protein or phosphoprotein abundance are provided through this tab. In this example, glioblastoma (GBM) samples with alterations in PTEN have increased phosphorylated AKT. (A) Phosphoproteins with different amounts when comparing PTEN-altered samples and PTEN-wild-type samples. The list is sorted by P values from a two-sample t-test. (B) Boxplot representation of the relative amount of AKT pT308 in PTEN-altered and PTEN-wild-type samples. This plot is generated by clicking the icon in the Plot column of the tabulated data. 第六個面板 survival如果生存數(shù)據(jù)可以獲得,那么tumor samples(查詢的gene至少有一個在腫瘤sample發(fā)生改變)之間的整體的生存和無病生存差異會被計算。這個結(jié)果以帶有p值的Kaplan-Meier圖展示(from logrank test)。 例子展示的ovarian cancer中BRCA1和BRCA2的突變。這個分析展示了BRCA1或BRCA2突變有明顯更好的總體和無病生存期。 步驟如下 1.執(zhí)行如Fig.7的條件。 2.選擇Survival 面板 3.查看總體生存期分析和免疾病生存期分析結(jié)果 4.可以下載pdf等格式文件。 (備注,現(xiàn)在都是上下展示,以前是并列) ![]() 16.png Fig. 7. The Survival tab The example shows the overall survival (A) and the disease-free survival (B) of ovarian cancer patients with or without BRCA1 or BRCA2 mutations. The red curves in the Kaplan- Meier plots includes all tumors with a BRCA1 or BRCA2 germline or somatic mutation, the blue curves includes all samples without a BRCA1 or BRCA2 mutation. 第七個面板Network這個network tab提供了cancer中改變的相互作用分析和網(wǎng)絡(luò)可視化。Network包含pathways和來自HPRD(Human Reference Protein Database),Reactome,NCI-nature(National Cancer Institue)和Memorial Sloan-Kettering Cancer Center(MSKCC) Cancer Cell Map (http://cancer.), 的相互作用,源自于open source Pathway Commons Project.默認(rèn)下,網(wǎng)絡(luò)自動生成,包含所有的查詢gene的所有鄰居(臨近節(jié)點)。If網(wǎng)絡(luò)中有多于50個neighbor genes存在,他們會根據(jù)在所選擇的癌癥中的genomic alternation 頻率進行排序,并且除了查詢的genes,只有最高改變頻率的50個neighbors展示。(only the 50 neighbors with the highest alternation frequency in addition to the query genes are shown).這對哪里網(wǎng)絡(luò)的復(fù)雜性和自動高亮和查詢的癌癥有關(guān)的genes非常有幫助。這個完整的未經(jīng)修剪的網(wǎng)絡(luò)可以SIF和GraphML格式下載,在cytoscape中進一步可視化和分析。默認(rèn)情況下,網(wǎng)站會自動根據(jù)相互作用的類型對邊加以顏色區(qū)分,并且每一個點覆蓋基因組data,高亮突變,CAN,mRNA上調(diào)下調(diào)頻率高的gene。顯示的數(shù)據(jù)和查詢中的設(shè)置有關(guān),并且,也和選擇的genomic profiles可行性有關(guān)。可以用不同的選擇對網(wǎng)絡(luò)進行過濾,并且可以根據(jù)gene symbol對網(wǎng)絡(luò)就行搜索。不同的選擇都會改變這個網(wǎng)絡(luò)的展示,同時結(jié)果自動改變。解釋網(wǎng)絡(luò)符號的說明都有提供。Genes之間的改變的和相互作用的細(xì)節(jié)通過點擊nodes和edge都可以進行查看。相互作用的類型源自于BioPAX到SIF 規(guī)則。例如,“In Same Componet”揭示的是Genes A和B 涉及同樣的BC,例如complex?!癝tate Change”說明Gene A引起一種狀態(tài)改變,比如Gene B的磷酸化改變?!癘ther”用于說明所有內(nèi)部作用的其他類型,包括來于HPRD的蛋白蛋白相互作用?!癟argeted by drug”說明drug-target相互作用。 Portal包含gene為中心的drug-target信息,來源一下resources:DrugBank,KEGG Drug,NCD cancer Drugs(http://www./cancertopics/druginfo/alphalist),Rask-Andersen,Rask-Andersen) 等。Drugs在網(wǎng)絡(luò)中隱藏,默認(rèn)顯示但可以使用genes & drugs菜單添加進網(wǎng)絡(luò)。用戶可以選擇展示U.S Food 和Drug Administration(FDA)-approved drugs,被NCI Cancer Drugs定義的癌癥藥物,或者靶向查詢genes的所有藥物。 通過選擇當(dāng)前網(wǎng)絡(luò)的genes可以生成網(wǎng)絡(luò),然后把這些genes當(dāng)作新的query進行提交。 例如,為了發(fā)現(xiàn)serous ovarian cancer中EGFR信號通路網(wǎng)絡(luò)基因組的改變,我們使用EGFR和ERBB2作為查詢genes來探索結(jié)果網(wǎng)絡(luò)。如Fig.8.使用顏色密碼作為指引,這種癌癥正發(fā)生變化的連接gene非常明顯。對于EFGR和ERBB2網(wǎng)絡(luò)MYC,一個已知的ERBB2下游效應(yīng)子 ,顏色很紅,因為它在ovarian cancer samples中擴增30%(Fig.8)。 通過添加drug data,gefitinib和erlotinib,這兩個都是已知的酪氨酸激酶抑制劑,它們靶向EGFR的催化結(jié)構(gòu)域,還有cetuximab和trastuzumab,這兩個是monoclonal抗體,分別靶向EGFR和ERBB2的胞外結(jié)構(gòu)域,用邊顯示連接到它們的靶標(biāo)Fig.8A。 具體步驟如下 -1.Fig8的條件執(zhí)行查詢 -2.選擇 network tab -3.從genes & Drugs tab選擇“show all drugs” (備注,現(xiàn)在在右邊的genes下的“drugs of specified genes”) -4.從顯示按鈕,選擇“l(fā)ayout properies”,并且設(shè)置最大距離到100來縮短邊的距離 ![]() 17.jpg -5.從layout button,選擇“perform layout” -6.filtering 網(wǎng)絡(luò)后,自動執(zhí)行l(wèi)ayout changes,選擇“auto layout on changes” -7.設(shè)置‘filter neighbors by alteration’到10 -8.通過單擊和重置nodes對nodes進行重排,以便更好的輸出 -9.雙擊MYC node可以查看基因組profile details -10.從view菜單,選擇“highlight neighbors”,然后選擇“remove highlights”來重置所有nodes和edges -11.view和過濾相互作用類型和sources in the interactions tab -12.雙擊line,鏈接flavopiridol到EGFR的線,可以查看細(xì)節(jié) -13.反選“merge ineractions”來顯示nodes之間不同作用類型的多個邊 -14.從view button,選擇“always show profile data”來可視化每個gene周圍的不同基因譜的變化頻率,反選可以去除。 -15.在“topology”button選項可以隱藏或顯示選擇的nodes或移除網(wǎng)絡(luò)中沒有鏈接的nodes。 -16.從genes & drugs選擇EGFR,ERBB2,MYC,單擊箭頭提交新的查詢 -17.使用瀏覽器back按鈕回到上一級結(jié)果 -18.下載GraphML或SIF可以在類似cytoscape的軟件中進行進一步分析。 下面這個圖是最新版的圖,2017.10.04 ![]() 18.jpg 現(xiàn)在的gene legend ![]() QQ圖片20180726134125.png 下面的是原文里的圖 ![]() 20.jpg Fig. 8. The Network tab The example shows network analysis of EGFR networks in serous ovarian cancer. (A)Network view of the EGFR and ERBB2 neighborhood in serous ovarian cancer (TCGA dataset) rendered with Cytoscape Web (34).The query genes, EGFR and ERBB2, are outlined with a thick border, and nearest neighbor genes are color-coded by their alteration frequency in ovarian cancer. One can display drugs that target EGFR or ERBB2 (hexagons; orange indicates FDA-approved), as well as details about genomic alterations and links to external resources for any gene in the network (bottom left, example MYC). (B) The “Gene Legend” accessed from the “Legend” button. Mousing over any gene in the network or single-clicking the gene displays multidimensional genomic data (copy number, mutation, and mRNA expression) onto all nodes in the network. (C) The “Interaction Legend” accessed from the “Legend” button. Double-clicking the edge displays additional details about the interaction between the two nodes. Edges can represent different interaction types (color-coded, such as “reacts with”). (D) Options for filtering, cropping, and searching the network are shown. 第8-10個面板:IGV,Download,bookmarkDownload tab提供所有的基因組數(shù)據(jù)下載和每個樣品的alteration的下載。 用戶可以下載tab-delimited text 文件,帶有所有查詢gene的數(shù)據(jù)或者僅僅需要的一些文件以便進一步分析。 Tab-delimited text文件兩種形式可以獲?。╥)矩陣,行代表gene,列代表samples(ii)轉(zhuǎn)置矩陣,也就是行代表samples,列代表genes 用戶也可以可視化copy number細(xì)節(jié),通過選擇開始一個web start version of IVG. IVG可以打開當(dāng)前癌癥研究的分割的拷貝數(shù)data并顯示所有查詢genes的拷貝數(shù)狀態(tài)。 Bookmark tabBookmark tab運行用戶保存或標(biāo)簽專門的query(整個的query可以儲存在URL形式)或通過生成短的URL(使用bit.ly)和同時一起分享結(jié)果 步驟如下 1.執(zhí)行任何的query 2.從IGV tab,點擊launch 按鈕加載data,開始viewer Note:所有samples的分割的copy-number data在IGV中可以可視化,無論那個cases被選擇來查詢 3.在Download tab,獲取tab-delimited格式的data,單擊超鏈接查看獲得的文件或打開URL在新tab或窗口。然后“select all”拷貝進電子表格或選擇file,然后“save page as”存儲為text file 4.從Download tab,把data放進電子表格或生成file手動的,復(fù)制粘貼每個text box中的data進入choise program 5.從Bookmark tab,右擊link 粘貼進瀏覽器產(chǎn)生個人bookmark或存儲鏈接到一個專門的query 6.從bookmark tab,press “shorten URL” 產(chǎn)生短的URL通過使用bit.ly (為特意查詢) Note通過點擊短的link或長版本可以加載bookmark頁面。 執(zhí)行cross-cancer 查詢Cross-cancer queries允許用戶估計單個gene或多個gene在多種不同的癌癥類型間的改變頻率和突變data??绨┌Y的mRNA表達或蛋白豐度data目前還不可行。網(wǎng)站會自動限制這種研究搜索以匹配到查詢參數(shù),這樣只有帶有mutation 信息的data包括進僅含突變的query并且只有帶有CAN的data信息被包含在CAN-only 查詢。結(jié)果以直方圖形式呈現(xiàn): -(i)一個顯示這些癌癥中的改變頻率,以降序排列 -(ii)一個顯示每個癌癥研究中,帶有和不帶有改變的samples的絕對number,這可以以帶有改變的數(shù)目下降的order進行。展現(xiàn)。如果多個genes被查詢,那么直方圖會展示綜合的改變或改變頻率(包含所有的選擇的gene)。關(guān)于查詢的genes的細(xì)節(jié)在oncoprints也有體現(xiàn)。這樣使得每種癌癥研究的每個選擇的gene的結(jié)果都可以可視化。 一個關(guān)于TP53的cross-cancer研究,這個gene編碼腫瘤抑制gene和轉(zhuǎn)錄調(diào)控子p53,顯示了cBioPortal的特性(Fig.9A)步驟如下 -1.主查詢page(Home)選擇“All Cancer Studies”. 備注,新版這個已經(jīng)變了。直接在下圖中select all 即可 ![]() 21.jpg -2.選擇“only mutation” Note: 這會自動不查詢限制到只有mutation data的癌癥研究中。 -3.輸入感興趣的gene或genes -4. press “submit” -5.press “sort” link 組織數(shù)據(jù),從發(fā)生突變頻率最高到最低的順序排列。(Fig.9B),也可以按字母順序排列 -6.左上角Y-Axis value 那里有個下拉框,可以按突變頻率排序也可以按absolute counts排序。 -7.鼠標(biāo)劃過任何bar都可以看到結(jié)果的詳細(xì)信息 -8.鼠標(biāo)左擊任何列表的bar可以查看選擇的genes在該cancer中的oncoprints ![]() 22.jpg (A) Users initiate a query against all cancer studies in three steps. (B) The results are displayed as a histogram of the alteration frequencies of the query gene (or genes) across cancer studies. The example shows that TP53 mutation frequencies are the highest in squamous cell carcinomas of ovary, lung, and head and neck. 查看癌癥研究summary data除了執(zhí)行特異gene queries,cBioPortal還提供access to 包含在portal中的每個癌癥研究的總結(jié)??色@得數(shù)據(jù)包括每個病人的不同的臨床details(生存和診斷時的年齡),關(guān)于tumor的細(xì)節(jié)(histology,stage,grade),遺傳學(xué)data的總結(jié)(非同源突變的數(shù)目,基因組改變的fraction),復(fù)發(fā)的突變gene的細(xì)節(jié),復(fù)發(fā)的CNAs的細(xì)節(jié)。臨床數(shù)據(jù)的呈現(xiàn)既可以有圖也可以有table(Fig.10). 突變的gene和CNAdata以tables的形式展現(xiàn)。所有的table都有搜索選項。搜索queries所有內(nèi)容(caseIDs,gene symbols,臨床特征),可以包含短語。步驟如下 -1.HOME選擇“Uterine Corpus Endometroid Carcinoma (TCGA, Provisional)” -2. ![]() 1111.jpg 摁那個summary按鈕。看細(xì)節(jié) -3.新版已經(jīng)不適應(yīng) -4.鼠標(biāo)放圖上可以看相關(guān)details -5.轉(zhuǎn)到clinical data可以通過點擊arrowheads對每列進行排序。 -6. 在紅色框里輸入deceased可以查看已故的人的信息 Note:搜索病人data的table不會更新選擇的病人的圖的data。 -7.刪除搜索框內(nèi)的text可以對整個cases的列表進行重排 -8.點擊“copy number alterations” 可以獲得染色體區(qū)域列表和帶有CNAs的基因的列表 -9.點擊“mutated genes”可以獲得循環(huán)的突變的genes列表 -10.點擊列表gene的任何一個可以執(zhí)行新的突變查詢(指定的癌癥指定的突變) -11.無用 -12.現(xiàn)在graph發(fā)生了很大變化。但總體多了。把鼠標(biāo)放到餅圖的扇形區(qū)域,點擊,整個界面都會發(fā)生變化,和點擊的扇形區(qū)域有關(guān)。 -13. 第12步選擇的條件都會在上方有顯示,然后可以逐一清除,也可以clear all,這樣就可以restore所有的plots和table。 ![]() 23.jpg 下面是新版的圖。 ![]() 24.jpg 下面這個是原始文章的圖 ![]() 25.jpg Fig. 10. The cancer study summary view The example shows an overview of clinical attributes and a scatter plot of mutation count versus fraction of genome altered for each case in the TCGA endometrial cancer study. 查看單個腫瘤的基因組改變:patient view在任意一個腫瘤sample中,都有潛在的可能發(fā)生上百或上千的基因組改變,對于選擇,檢查和分析,那些對癌癥發(fā)生或影響治療的反應(yīng)的改變的事件,就極其重要。因此,除了跨越許多samples,不同tumor types和癌癥研究總結(jié)data,除了gene-by-gene 改變地圖,用戶也可以查看個體tumor sample的基因組改變,在一個交互式病人view page。在oncoprint(對每一個基因組event可以鼠標(biāo)看細(xì)節(jié))可以看到這些鏈接,除了在oncoprint,還可以在mutations tab,cancer study summary page也可以看到。 病人查看界面總結(jié),可視化關(guān)于tumor的所有相關(guān)數(shù)據(jù),包括臨床特征,突變和拷貝數(shù)變異程度總結(jié),關(guān)于突變,擴增和刪除gene的細(xì)節(jié)(Fig.11)。這個結(jié)果以tabbed displays展示??偨Y(jié)tab中的基因組改變以以下條件進行過濾 跨越tumor集合的突變或CNAs復(fù)發(fā)(frome MutSig 和GISTIC),COSMIC中的圖表發(fā)生,癌基因注釋(比如sanger cancer gene census)。也提供關(guān)于藥物和靶標(biāo)的信息。步驟如下 -1.頂部的導(dǎo)航pane點擊“DATA SETS”按鈕。 ![]() 26.jpg -2.點擊“Uterine Corpus Endometrioid Carcinoma (TCGA, Provisional).” 這一步的效果和上面那個點那個柱狀圖效果一樣。 -3.搜索框內(nèi)輸入“TCGA-FI-A2D2” 點擊右邊紅色框后,會出現(xiàn)左邊的框,然后在左邊那個紅色框里輸入 ![]() 27.jpg 實際是執(zhí)行下步,也就是需要點擊那個小人 ![]() 28.jpg -5.忽略 -6.鼠標(biāo)劃過mutations和CNA tables 的列頭獲得更多關(guān)于每列的信息 ![]() 29.jpg Fig. 11. The cBioPortal patient view The example shows the relevant genomic alterations and clinical data of an endometrial cancer sample with mixed histology from the TCGA study. ![]() 30.jpg ![]() |
|
|