|
首選你得知道如何進(jìn)入TCGA數(shù)據(jù)庫(kù),知道如何選擇需要的癌癥分類,和數(shù)據(jù)類型,在選擇基因表達(dá)的時(shí)候,經(jīng)常遇到一個(gè)問(wèn)題,有個(gè)選項(xiàng):HTSeq-Counts,HTSeq-FPKM,HTSeq-FPKM-UQ,不少學(xué)員對(duì)此產(chǎn)生困惑,這里究竟應(yīng)該如何選擇,每個(gè)選項(xiàng)究竟是什么意思。 ![]() 簡(jiǎn)單的講,Counts是數(shù)據(jù)后臺(tái)沒(méi)有處理的原始表達(dá)量,而FPKM和FPKM-UQ是兩種數(shù)據(jù)處理方法,也就是說(shuō),如果下載Counts數(shù)據(jù),是表達(dá)量數(shù)據(jù),如果下載FPKM數(shù)據(jù),那么要注意這些數(shù)據(jù)是經(jīng)過(guò)處理的。正常情況下,我們下載Counts數(shù)據(jù)就可以了,特殊情況選擇FPKM數(shù)據(jù)也是可以的。 接下來(lái)我們來(lái)看看FPKM的具體概念,究竟是什么樣的處理結(jié)果: ![]() 下載數(shù)據(jù)后,在數(shù)據(jù)分析時(shí),用的方法也是不同的,Counts數(shù)據(jù)一般使用edgeR包或DESeq包,對(duì)數(shù)據(jù)做分析;如果下載FPKM數(shù)據(jù),就不能使用edgeR包,只能只用DESeq包進(jìn)行處理。 在使用edgeR包做Counts數(shù)據(jù)處理時(shí),是需要對(duì)數(shù)據(jù)進(jìn)行normalize的,所以我們?cè)谙螺d數(shù)據(jù)時(shí),下載counts是比較常用的。 責(zé)任編輯:森莘 |
|
|