小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

<optgroup id="e2e9p"></optgroup>

<optgroup id="e2e9p"></optgroup>

<dl id="e2e9p"></dl>

搜索

分享

QQ空間 QQ好友新浪微博微信

簡單七步教你處理芯片原始數據

田明17grajsnth 2017-09-24

展開全文

廣告：工作室提供有償芯片數據分析，大家有芯片相關數據處理，請留言....

很久沒有處理芯片原始數據了，一般情況下去GEO下載數據的時候都是直接下載處理后的，所以用著用著也就懶了，今天去下載GSE42743的數據如圖，發(fā)現竟然沒有處理好的，糾結之余小編決定親自從原始數據入手，開啟洪荒之力。

下面小編就一步一步教你實戰(zhàn)GEO芯片原始數據處理

01

下載芯片數據，進入GEO首頁搜索跟自身研究相關的GEO數據集，找到合適的數據比如GSE42743,點擊進去找到如下圖所示，可以看到File type為CEL即為原始數據啦，看到左側有個http有木有，點擊下載就哦啦

02

安裝affy包，很顯然原始芯片數據需要專門的包去處理，這里要使用affy包進行數據處理，所以安裝這個affy包也很簡單，有兩種方法如下：

1、install.package('affy')

2、

source('https:///biocLite.R')

biocLite('affy')

擇其一選擇安裝即可，如果一種方法不行就換一種

03

導入affy包，這里因為affy包可能用到其他的包，所以導入affy包之前需要導入它所依賴的包，如果沒有安裝的話，就自行安裝就好了，導入包如下：

library(BiocGenerics)

library(parallel)

library(Biobase)

library(affy)

04

設置數據環(huán)境，導入affy完畢了之后，現在需要配置數據環(huán)境以便能夠對原始數據提取，先解壓下載下來的GSE42743_RAW文件，然后可以看到所有的CEL文件都在這個文件夾下面，可能你會發(fā)現后綴怎么會有個gz，不用擔心這是一種數據壓縮格式，affy會自動解壓，無需自己提前解壓；現在要設置當前操作目錄，使用命令如下：

setwd('E:/Work/P1/SH824/GSE42743_RAW')

注意哦，路徑別寫錯啦

05

讀取原始數據啦，通過包的導入和數據環(huán)境的準備之后，現在開始讀取數據，也很簡單啦，有兩種方式哦，代碼如下：

1、rawdata <- ReadAffy()###讀取全部的原始文件，這個時候就考驗你的電腦內存了

2、rawdata1 <- ReadAffy('GSM1049165_MDA-HNS-112.CEL.gz')###讀取單個原始文件

06

標準化，讀取完數據當然是處理和標準化啦，這一步呢也是一條命令的事，但是芯片數據標準化方法很多，小編常常使用的兩種標準化方法分別為rma和mas5，這里都奉獻給你吧，代碼如下：

1、eset <- rma(rawdata) #rma標準化方式

2、eset <- mas5(rawdata)#mas5標準化方式

注意哦，rma只使用pm信號，exp數據已經進行l(wèi)og2處理。mas5綜合考慮pm和mm信號，exp數據沒有取對數。

07

很顯然，現在要把得到的芯片數據標準化的結果進行保存了，使用代碼如下：

write.exprs(eset, file='NormalizedData.txt')

保存在了當前工作目錄下哦

當然如果你不想保存，還想繼續(xù)用的話就使用exprs函數進行轉換成表達譜矩陣啦，代碼如下：

exp <- exprs(eset)

總結一下小編的代碼如下

library(BiocGenerics)

library(parallel)

library(Biobase)

library(affy)

setwd('GSE42743_RAW')

rawdata <- ReadAffy()

eset <- rma(rawdata)#eset <- mas5(rawdata)

#rawdata1 <- ReadAffy('GSM1049165_MDA-HNS-112.CEL.gz')

write.exprs(eset, file='NormalizedData.txt')

小貼士

這其中呢要畫圖嘛，主要涉及兩張圖，一張是標準化前的，一張是標準化后的箱線圖，其實也很簡單啦

標準化前，繪圖，代碼如下：

boxplot(exprs(rawdata))

沒圖?。。。∫驗樾【庪娔X死機了

標準化后，繪圖代碼如下：

boxplot(exprs(eset))

怎么看這個前后效果呢，就看圖中小編畫了紅色的那條線，中位數的分布是否在一條線上，很明顯標準化前都不全在一條線上（無圖無真相，自己試吧），標準化后在一條線上了。

本站是提供個人知識管理的網絡存儲空間，所有內容均由用戶發(fā)布，不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息，謹防詐騙。如發(fā)現有害或侵權內容，請點擊一鍵舉報。

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：田明17grajsnth > 《GSEA》

舉報/認領

0條評論

請遵守用戶評論公約

類似文章 更多

田明17grajsnth

關注對話

TA的最新館藏

聽說10分以上的雜志，NC灌水最容易？
干細胞研究必看的經典綜述
(主題篇)S5E31：一文了解RNA甲基化的來龍去脈
如何從芯片數據中“刨”出想要的基因？
有關lncRNA不得不看的十篇綜述！
microRNA研究的幾種新模式……

喜歡該文的人也喜歡更多

熱門閱讀換一換

<delect id="whnzd"><pre id="whnzd"></pre></delect>