| 聽說看到這個標題你是一臉懵逼的狀態(tài)!那就讓omicsPie的老司機們帶你飛吧!點贊關(guān)注打賞組學派的小伙伴們早就走上人生巔峰了,你還在等什么?仔細閱讀文章哦,文中有彩蛋,看你有沒有發(fā)現(xiàn)! 在組學研究課題中,如果提起數(shù)據(jù)庫,你會想到什么?小編敢肯定,KEGG數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書)必將位列前幾位。作為系統(tǒng)生物學的重要工具,KEGG系統(tǒng)地包含了基因組、酶促反應以及生物化學物質(zhì)等等,為基因組、轉(zhuǎn)錄組、蛋白組、代謝組等組學研究的數(shù)據(jù)挖掘提供了重要的支撐。 雖然KEGG可以在線訪問,但對組學研究的童鞋們來說,能夠批量訪問和使用才是王道。今天,小編給介紹KEGG中為批量訪問而提供的一個重要工具,KEGG API接口。通過它,大家就可以方便地將KEGG整合到大家的工作當中。KEGG API是一個連接KEGG各類數(shù)據(jù)庫的應用程序,主要以URL形式進行訪問:http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]]<operation> = info | list | find | get | conv | link | ddi 1. 總體的調(diào)用形式: URL 形式: http://rest./<operation>/<argument>[/<argument2[/<argument3> ...]] <operation> = info | list | find | get | conv | link | ddi 總共7種操作可以選擇,包括info, list, find, get, conv, link, ddi。后面會具體介紹。 Database 名稱 KEGG數(shù)據(jù)庫包括了三大類的數(shù)據(jù)庫,包括 KEGG database; KEGG MEDICUS extension database; Outside database (主要用于ID的變換)。 Database entry identifier(標識符) 命名規(guī)則: KEGG自身帶有17個數(shù)據(jù)庫,除了“genes”, 'enzyme', 'variant'均使用KEGG 標識符<kid>。 <kid>: 數(shù)據(jù)庫前綴 5位數(shù)字組成,比如K number (kegg orthology), C number (kegg compound), D number (kegg drug)。例:ADP的kid為C00008 genes: <org>:<gene>, <org>為KEGG organism code或T number genome identifier,<gene>是基因編號,通常來自NCBI GeneID或INSDC Locus_tag。 例如hsa:10458為human的BAP2基因(NCBI-GeneID :1045) enzyme & variant: <database>:<entry>, <database>為database縮寫,<entry>是名稱或編號。 KEGG database Output: 純文本格式 操作list, find,conv, link:Tab分隔的文本 操作get:數(shù)據(jù)庫形式(flat file database format) 操作info:文本消息 HTTP狀態(tài): 狀態(tài)代碼 200: 成功 狀態(tài)代碼 400: 請求失敗 (比如語法錯誤) 狀態(tài)代碼 404: 未找到 舉個簡單的離子: 在瀏覽器中輸入http://rest./info/kegg,可以得到整個KEGG數(shù)據(jù)庫的統(tǒng)計信息 累了吧,送你一張實拍美圖,休息一下 KEGG API操作 1. Info: 呈現(xiàn)數(shù)據(jù)庫的統(tǒng)計信息 使用方法: 例:http://rest./info/kegg:所有KEGG數(shù)據(jù)庫的數(shù)目統(tǒng)計信息 2. List: 獲取每個條目的編號和定義 使用規(guī)范: 例: http://rest./list/pathway/hsa: 可以得到人類所有的代謝通路 
 也可以具體到某個或幾個基因:http://rest./list/hsa:10458 ece:Z5100 
 3. Find: 通過關(guān)鍵詞檢索數(shù)據(jù) 使用方法: 
 例: 搜索含有NAD的compound: http://rest./find/compound/NAD 
 所有分子式為C7H10O5的compound: http://rest./find/compound/C7H10O5/formula 
 平均分子量為300-310的compound: http://rest./find/compound/300-310/mol_weight 
 4. Get: 得到數(shù)據(jù)庫中的具體條目 使用方法: 例: 檢索編號為C01290的compound: http://rest./get/cpd:C01290 
 
 檢索人類編號為05130的pathway圖:http://rest./get/hsa05130/image 
 5. Conv: 把KEGG的標識符轉(zhuǎn)化為其他標識符 使用方法: 
 例: 把將KEGGID 轉(zhuǎn)化為NCBI Protein ID: http://rest./conv/ncbi-proteinid/hsa:10458 ece:Z5100 
 把編號為C00003的compound轉(zhuǎn)化為pubchem ID: http://rest./conv/pubchem/C00002 
 6. Link: 在不同數(shù)據(jù)庫之間進行檢索,把KEGG的各個數(shù)據(jù)庫連接在一起 使用方法: 
 例:檢索pathway 00010中的compound:http://rest./link/cpd/map00010 
 檢索hsa10458基因參與的pathway: http://rest./link/pathway/hsa:10458 
 7. DDI: 藥物與藥物之間的作用 使用方法: 
 例:檢索藥物D00564的已知相互作用:http://rest./ddi/D00564 
 檢索藥物D00564、D00100、D00109相互之間的作用: http://rest./ddi/D00564 D00100 D00109 
  | 
|  |