|
這一期小編和大家一起學(xué)習(xí)一下癌癥芯片表達(dá)數(shù)據(jù)相關(guān)的數(shù)據(jù)庫(kù)。盡管目前轉(zhuǎn)錄組深度測(cè)序技術(shù)被廣泛應(yīng)用,基因芯片技術(shù)依靠其低成本和癌癥研究的大樣本量需求使得芯片數(shù)據(jù)目前仍在不斷的產(chǎn)生。與RNA-seq數(shù)據(jù)產(chǎn)生的方式有所不同,芯片數(shù)據(jù)產(chǎn)生的平臺(tái)多樣,平臺(tái)之間的數(shù)據(jù)往往不能直接比較。這對(duì)于芯片數(shù)據(jù)跨平臺(tái)的比較和整合分析是不利的。幸運(yùn)的是,一些很好的芯片數(shù)據(jù)庫(kù)和分析平臺(tái)被開(kāi)發(fā)。 GEO (https://www.ncbi.nlm./geo/)與ArrayExpress(http://www./arrayexpress/)存儲(chǔ)了大部分已公開(kāi)的基因芯片表達(dá)原始數(shù)據(jù)和歸一化數(shù)據(jù),主要是來(lái)源于全世界科學(xué)家的科研工作。當(dāng)然,這也包括大量的癌癥研究工作。對(duì)于GEO,用戶(hù)可以利用關(guān)鍵詞進(jìn)行搜索,如Humancancer。圖1.1是搜索結(jié)果頁(yè)面。用戶(hù)可以通過(guò)左邊欄選項(xiàng)對(duì)查詢(xún)結(jié)果進(jìn)行過(guò)濾。圖1.2是一個(gè)數(shù)據(jù)集的下載頁(yè)面。對(duì)于ArrayExpres,用戶(hù)也可以利用關(guān)鍵詞進(jìn)行搜索,如Cancer,圖1.3是結(jié)果頁(yè)面。同樣用戶(hù)也可以進(jìn)行數(shù)據(jù)過(guò)濾和數(shù)據(jù)下載(圖1.4)【1-2】。 圖1.1 GEO 查詢(xún)結(jié)果頁(yè)面 圖1.2 GEO 數(shù)據(jù)集下載頁(yè)面 圖1.3 ArrayExpress查詢(xún)結(jié)果頁(yè)面 圖1.4 ArrayExpress數(shù)據(jù)集下載頁(yè)面 GENT(http://medicalgenome.kribb./GENT/)收集了41000個(gè)癌癥組織、癌癥細(xì)胞系、和正常組織的芯片表達(dá)數(shù)據(jù)。并通圖形化展示了在組織、細(xì)胞系中的表達(dá)模式。用戶(hù)可以基于表達(dá)模式,找到一些表達(dá)異常的基因。用戶(hù)可以根據(jù)基因名或者Affymetrix ID搜索。圖1.5展示了ERBB2在癌癥和正常組織中表達(dá)情況。此外,用戶(hù)還可以同時(shí)搜索多個(gè)基因在多個(gè)組織中的表達(dá)模式情況【3】。 圖1.5 ERBB2基因在癌癥和正常組織中的表達(dá) Oncomine(https://www./resource/login.html)是一個(gè)癌癥芯片數(shù)據(jù)庫(kù)和整合型的數(shù)據(jù)挖掘平臺(tái)。該數(shù)據(jù)庫(kù)收集了715套芯片表達(dá)數(shù)據(jù)集,共包含了86733個(gè)樣本以及相關(guān)的臨床數(shù)據(jù)。用戶(hù)既可以得到一個(gè)基因的差異表達(dá)分析,也可以得到某一個(gè)研究工作中所有差異表達(dá)的基因。差異表達(dá)分析可以在癌癥與正常組織之間、不同癌癥亞型組織之間、基于臨床和病理數(shù)據(jù)分類(lèi)的樣本之間進(jìn)行。此外,用戶(hù)還可以進(jìn)行多基因搜索、依據(jù)Gene ontology和臨床的注釋信息進(jìn)行過(guò)濾。圖1.6是Oncomine主界面,圖1.7是Oncomine數(shù)據(jù)呈現(xiàn)界面【4】。 圖1.6 Oncomine主界面 圖1.7 Oncomine數(shù)據(jù)呈現(xiàn)頁(yè)面 CancerMA(http://www./)一個(gè)芯片數(shù)據(jù)meta-analysis分析平臺(tái)。其芯片數(shù)據(jù)來(lái)源于GEO與ArrayExpress。目前,包含了來(lái)自13種癌癥的80套數(shù)據(jù)集。用戶(hù)上傳關(guān)心的基因名列表之后,該數(shù)據(jù)庫(kù)會(huì)基于基因表達(dá)信息進(jìn)行meta-analysis來(lái)找到新的候選癌癥生物標(biāo)志物。圖1.8是數(shù)據(jù)最后的提交頁(yè)面,用戶(hù)需提供郵箱地址。圖1.9是CAV1基因在肺癌中meta-analysis分析部分結(jié)果【5】。 圖1.8 CancerMA數(shù)據(jù)提交頁(yè)面 圖1.9 CAV1基因在肺癌中分析結(jié)果 參考文獻(xiàn)
1. BarrettT, Edgar R: Gene expression omnibus: microarray data storage, submission,retrieval, and analysis. Methods in enzymology 2006, 411:352-369. 2. ParkinsonH: ArrayExpress--a public repository for microarray gene expression data at theEBI. Nucleic acids research 2004, 33(Database issue):D553-D55 3. Seon-YoungK, Gwangsik S, Kang, Sungjin Y, Su-Jin B, Yong-Su J: GENT: Gene ExpressionDatabase of Normal and Tumor Tissues. Cancer Informatics 2011:149. 4. RhodesDR, Yu J, Shanker K, Deshpande N, Varambally R, Ghosh D, Barrette T, Pandey A,Chinnaiyan AM: ONCOMINE: a cancer microarray database and integrateddata-mining platform. Neoplasia 2004, 6(1):1-6. 5. FeichtingerJ, McFarlane RJ, Larcombe LD: CancerMA: a web-based tool for automaticmeta-analysis of public cancer microarray data. Database : the journal ofbiological databases and curation 2012, 2012:bas055. |
|
|
來(lái)自: teszsz > 《臨床遺傳學(xué)》