機(jī)不可失!國(guó)際臨床研究學(xué)院特邀著名生物統(tǒng)計(jì)學(xué)家林丹瑜教授開(kāi)設(shè)生存分析實(shí)操專欄,現(xiàn)面向廣大讀者征集問(wèn)題。無(wú)論你是臨床醫(yī)生、統(tǒng)計(jì)分析師、科研小白,不妨大膽提問(wèn),直接公眾號(hào)下方留言,或掃碼加入互動(dòng)交流群,與同道們共同探討:
|
統(tǒng)計(jì)下午茶 科學(xué)發(fā)展的漫漫長(zhǎng)河中,不乏無(wú)心插柳柳成蔭的軼聞趣事。很多應(yīng)用廣泛的經(jīng)典統(tǒng)計(jì)方法正是因其他領(lǐng)域的需要才發(fā)明的,譬如,現(xiàn)代統(tǒng)計(jì)學(xué)的起源者費(fèi)舍爾(Fisher)當(dāng)年是個(gè)遺傳學(xué)教授,而不是統(tǒng)計(jì)學(xué)教授。而在腫瘤臨床研究中,想要評(píng)價(jià)兩種治療措施對(duì)于患者生存期的影響,或者腫瘤復(fù)發(fā)的影響,生存分析是最常用的分析方法之一。現(xiàn)代生存分析方法的起源是什么?為何如此流行?國(guó)際著名生物統(tǒng)計(jì)學(xué)家林丹瑜教授邀您一窺究竟。 生存分析這一概念的起源? 生存分析(survival analysis)是一個(gè)歷史悠久的概念,最早在1662年就被提出,用來(lái)估計(jì)死亡的時(shí)間和概率,即包括起點(diǎn)和終點(diǎn)的時(shí)間變量分析。 第二次世界大戰(zhàn)期間,隨著對(duì)軍事設(shè)備可靠性測(cè)試的廣泛興趣,生存分析在其他領(lǐng)域得以應(yīng)用。二戰(zhàn)以后,隨著醫(yī)學(xué)研究的迅速發(fā)展,也給生存分析帶來(lái)很多動(dòng)力。 Kaplan–Meier曲線(K-M曲線)和Cox Proportional Hazard Model(Cox回歸)是現(xiàn)代生存分析方法的起源。 Kaplan–Meier曲線的由來(lái)? Kaplan-Meier是一種非參數(shù)的單變量分析方法,根據(jù)生存時(shí)間分布,估計(jì)生存率以及中位生存時(shí)間,以生存曲線方式展示,從而分析生存特征。 它的特殊性在于數(shù)據(jù)收集過(guò)程當(dāng)中,考慮到Censored Data(截尾數(shù)據(jù)或刪失數(shù)據(jù)),不能觀察所有人的生存時(shí)間,而是估計(jì)生存的分布情況,幫助研究人員找到某一群體(如臨床試驗(yàn)的參與者)的生存模式。 介紹Kaplan-Meier的論文是美國(guó)統(tǒng)計(jì)學(xué)家Edward Kaplan和Paul Meier在1958年發(fā)表的,2014年《自然》雜志邀請(qǐng)湯森路透公司列出了有史以來(lái)引用次數(shù)最高的100篇論文中,該論文成為被引用最頻繁的統(tǒng)計(jì)學(xué)論文(第11位)。 有意思的是,盡管膾炙人口,以至于大多以為Kaplan-Meier是某個(gè)人的名字,Edward Kaplan和Paul Meier之間卻并不認(rèn)識(shí)。實(shí)際的情況是,兩人分別單獨(dú)寫好論文,都寄往《美國(guó)統(tǒng)計(jì)學(xué)會(huì)會(huì)刊》(JASA),由于時(shí)間相近、方法一樣,編輯促使了倆人的合作,這也就是Kaplan-Meier的由來(lái)。 為什么Kaplan-Meier如此流行? 實(shí)際上,Kaplan-Meier一開(kāi)始幾乎沒(méi)有獲得任何引用,直到20世紀(jì)70年代,隨著計(jì)算能力的飛速上升,讓非計(jì)算機(jī)專家也能使用該方法后,情況才有改觀。Kaplan-Meier是一種非參數(shù)的估計(jì)方法,不需要假定參數(shù)分布,統(tǒng)計(jì)方法的簡(jiǎn)潔性和易用性提高了這一論文的受歡迎程度。 Cox回歸又是怎么來(lái)的? 英國(guó)統(tǒng)計(jì)學(xué)家David Cox在1972年進(jìn)一步拓展了Kaplan-Meier,將性別和年齡等因素包含在內(nèi),也就是今天所說(shuō)的Cox Proportional Hazard Model(Cox回歸),發(fā)表的論文在統(tǒng)計(jì)學(xué)領(lǐng)域引用次數(shù)排名第二(第24位)。值得注意的是,Cox回歸的分布本身同樣也不含參數(shù)假設(shè),只是性別、年齡等影響因素對(duì)生存概率的影響是用參數(shù)來(lái)表達(dá)的。 坊間傳聞,David Cox在生病的時(shí)候偶然得到這個(gè)想法,后來(lái)病好了就忘了,過(guò)一段時(shí)間后又想起來(lái)了,就寫下來(lái)這篇論文,具體的靈感來(lái)源也就無(wú)從考究。 兩篇論文被引用次數(shù)很多,很大一部分原因在于臨床試驗(yàn)(尤其癌癥領(lǐng)域)應(yīng)用廣泛,不僅如此,它們?cè)诹餍胁W(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)學(xué)、工業(yè)的可靠性測(cè)試等方面,都有著非常廣泛的應(yīng)用。 ![]() 圖注:如果將Web of Science收錄的所有論文的第一頁(yè)打印出來(lái)堆在一起,這座論文山的高度便將與乞力馬扎羅山相當(dāng),只有山頂1.5米高的論文被引用了1500此或以上,1.5厘米高度的論文被引用超過(guò)一萬(wàn)次。 參考資料: 1# The top 100 papers——Nature explores the most-cited research of all time. Richard Van Noorden,Brendan Maher& Regina Nuzzo. 29 October 2014. https://www./news/the-top-100-papers-1.16224 專家簡(jiǎn)介 ![]() 林丹瑜教授:美國(guó)北卡羅來(lái)納大學(xué)的丹尼斯·吉林斯(Dennis Gillings)杰出教授,萊恩伯格綜合癌癥中心成員和艾滋病研究中心成員。作為國(guó)際著名的生物統(tǒng)計(jì)學(xué)家,林教授對(duì)生物統(tǒng)計(jì)學(xué)的理論和方法,尤其是生存分析、臨床實(shí)驗(yàn)設(shè)計(jì)與分析,做出了許多開(kāi)創(chuàng)性的貢獻(xiàn)。在國(guó)際領(lǐng)先的統(tǒng)計(jì)和醫(yī)學(xué)雜志上發(fā)表了200余篇的學(xué)術(shù)論文,被引用頻次超過(guò)4萬(wàn)。他發(fā)拓的許多統(tǒng)計(jì)方法已被納入流行的教科書和主要的統(tǒng)計(jì)軟件包,在臨床實(shí)驗(yàn)和流行病研究中有廣泛的應(yīng)用。由于對(duì)衛(wèi)生統(tǒng)計(jì)領(lǐng)域的卓越貢獻(xiàn),林教授于1999年獲得美國(guó)衛(wèi)生協(xié)會(huì)頒發(fā)的著名Mortimer Spiegelman 金質(zhì)獎(jiǎng)?wù)?,?015獲得國(guó)際統(tǒng)計(jì)聯(lián)合會(huì)頒發(fā)的著名George W. Snedecor 獎(jiǎng)?wù)?,是為?shù)不多獲得美國(guó)國(guó)家衛(wèi)生研究院頒發(fā)的杰出貢獻(xiàn)獎(jiǎng)的科學(xué)家。他是美國(guó)統(tǒng)計(jì)協(xié)會(huì)和國(guó)際數(shù)理統(tǒng)計(jì)學(xué)會(huì)的當(dāng)選會(huì)士。長(zhǎng)期擔(dān)任頂級(jí)國(guó)際學(xué)術(shù)期刊《Biometrika》和《Journal of the American Statistical Association 》的副主編,也是美國(guó)食品和藥物管理局(FDA)的特別顧問(wèn)。 機(jī)不可失!國(guó)際臨床研究學(xué)院特邀著名生物統(tǒng)計(jì)學(xué)家林丹瑜教授開(kāi)設(shè)生存分析實(shí)操專欄,現(xiàn)面向廣大讀者征集問(wèn)題。無(wú)論你是臨床醫(yī)生、統(tǒng)計(jì)分析師、科研小白,不妨大膽提問(wèn),直接公眾號(hào)下方留言,或掃碼加入互動(dòng)交流群,與同道們共同探討: 點(diǎn)亮“在看”,好文相伴 |
|
|