|
要聊起今天的話(huà)題就得從流行病學(xué)講起。人們通常采用隨機(jī)對(duì)照試驗(yàn)(random control trial, RCT)研究暴露因素X與疾病結(jié)局Y之間的直接關(guān)聯(lián)證據(jù),但該方法往往受限于人類(lèi)醫(yī)學(xué)倫理與諸多的試驗(yàn)設(shè)計(jì),再加上近年來(lái)廣泛出現(xiàn)的大樣本GWAS數(shù)據(jù),表觀(guān)遺傳學(xué)以及各種“組學(xué)”數(shù)據(jù),使得在因果關(guān)系推斷的研究中面臨諸多挑戰(zhàn)。借助孟德?tīng)栯S機(jī)化(Mendelian Randomization, MR)的設(shè)計(jì)思想,將基因或者表觀(guān)遺傳標(biāo)記作為待研究暴露因素的工具變量,為解決上述問(wèn)題提供了有效的途徑。 本文以筆記的形式簡(jiǎn)要介紹孟德?tīng)栯S機(jī)化的理論基礎(chǔ)和基于GWAS數(shù)據(jù)的R包實(shí)踐。 MR法研究設(shè)計(jì)原理首先,通過(guò)回憶高中物理知識(shí)大家都知道孟德?tīng)栠z傳的基本思想遵循
在該模型中,遺傳變異可以直接準(zhǔn)確測(cè)量,并且不受外界環(huán)境等因素影響,屬于長(zhǎng)期而穩(wěn)定的暴露因素,因此,MR設(shè)計(jì)可以最大程度的降低偏倚的作用。 兩樣本MR(Two-sample MR)單獨(dú)介紹兩樣本MR是因?yàn)槠湓O(shè)計(jì)策略是建立在遺傳變異-暴露因素和遺傳變異-結(jié)局變量的關(guān)聯(lián)研究人群來(lái)自相同的人群的兩個(gè)獨(dú)立樣本,如暴露因素的GWAS研究和結(jié)局變量的GWAS研究。經(jīng)過(guò)改進(jìn)的兩樣本MR方法具有一個(gè)顯著的優(yōu)點(diǎn),即不依賴(lài)基因型數(shù)據(jù),只需通過(guò)現(xiàn)有GWAS結(jié)果統(tǒng)計(jì)量即可估算暴露因素與結(jié)局變量之間的因果關(guān)聯(lián)。2018年發(fā)表在《eLife》上面的一篇文章(PMID:29846171)開(kāi)發(fā)了一個(gè)數(shù)據(jù)庫(kù)和R包,專(zhuān)門(mén)針對(duì)現(xiàn)有GWAS數(shù)據(jù)進(jìn)行兩樣本MR分析。 借助巨人的肩膀——TwoSampleMR我們以實(shí)戰(zhàn)的形式介紹軟件的使用,具體的理論基礎(chǔ)和更多的細(xì)節(jié)請(qǐng)讀者參考原著論文和其他相關(guān)資料。 完成整個(gè)MR分析可以分為四個(gè)步驟:
實(shí)戰(zhàn)代碼一些需要注意的事熟悉遺傳學(xué)研究的朋友都知道基因是具有多效性的(pleiotropy),也就是說(shuō)一個(gè)SNP可能不單單與目標(biāo)暴露因素有關(guān),也存在同時(shí)與其他暴露因素有關(guān)系的可能性,在這種情況下,需要進(jìn)行敏感性分析(sensitivity analysis)來(lái)確定非特異SNP的存在對(duì)結(jié)果造成的影響。另一方面,如果多個(gè)SNPs共同作為工具變量,基因多效性帶來(lái)的偏倚也會(huì)存在,可以使用MR-Egger回歸分析的方法來(lái)評(píng)價(jià)偏倚大小。 參考文獻(xiàn): 王莉娜, Zuofeng Z . 孟德?tīng)栯S機(jī)化法在因果推斷中的應(yīng)用[J]. 中華流行病學(xué)雜志, 2017, 38(4):547. Gibran Hemani, Jie Zheng, Kaitlin H Wade, Charles Laurin, Benjamin Elsworth, Stephen Burgess, Jack Bowden, Ryan Langdon, Vanessa Tan, James Yarmolinsky, Hashem A. $The MR-Base platform supports systematic causal inference across the human phenome. eLife 2018. 轉(zhuǎn)自生信草堂公眾號(hào),已授權(quán) 文獻(xiàn)請(qǐng)?jiān)诠娞?hào)獲取~ |
|
|
來(lái)自: 高六博 > 《文獻(xiàn)解讀》