|
面對這樣的數(shù)據(jù)該如何統(tǒng)計分析呢?辦法當然有,由于最初這類方法被應(yīng)用于針對死亡結(jié)局的分析中,所以這類分析被稱為:生存分析。其中,Kaplan-Meier方法是幫助我們描述生存結(jié)局(或者說,終點事件)發(fā)生情況的有效手段。 為了方便理解,我們首先回顧一下這類研究的過程。已疾病死亡為例。 我們用橫軸表達研究的時間軸,隨著研究的開始,患者開始納入研究: 隨著時間的推移,越來越多的患者加入到研究中: 繼續(xù)我們的觀察,開始有患者出現(xiàn)了我們所期待的終點事件,像這樣獲得了終點事件的觀察數(shù)據(jù)我們稱其為完全數(shù)據(jù): 當然,也有患者在沒有出現(xiàn)所期待的終點事件的情況下離開研究(比如失訪的患者)。此類未能獲得終點事件發(fā)生情況的數(shù)據(jù)我們稱之為刪失數(shù)據(jù): 隨著時間推移,越來越多的患者出現(xiàn)了所期待的終點事件,當然也有不少人悄悄離開: 當然,到了研究結(jié)束的時刻,也一定還有對我們不離不棄但一直沒有出現(xiàn)預(yù)期終點事件的患者不得不離開研究: 面對這樣的數(shù)據(jù)我們應(yīng)該如何描述他的生存特征呢?很顯然,如果我們僅僅把患者按照是否觀察到預(yù)期的終點事件分為兩類顯然是不公平的: 因為刪失病例完全有可能因為觀察時間的不足而導(dǎo)致未來得及發(fā)生期待的終點事件。從終點事件的觀察角度看,刪失數(shù)據(jù)的信息是不完整的,我們并不知道這樣的病例會在什么時刻發(fā)生我們期望看到的終點事件而僅僅知道在他的隨訪時間內(nèi),這個病例沒有出現(xiàn)期待的終點事件。 在這種情況下,采用生存分析方法才是合理的選擇。 其中,Kaplan-Meier方法是幫助我們描述終點事件發(fā)生率的有效手段。 要怎么做呢? 首先,我們需要把所有研究對象按照隨訪時間的長度整齊排列(當然不用手工完成,有軟件在,我們明白道理就好): 然后繪制曲線。 怎么畫出來的,一會兒再說。我們先看看曲線都告訴我們什么:他的橫軸是時間,縱軸是生存率: 也就是說Kaplan-Meier曲線為我們描畫了患者生存率隨時間變化的特征。他完美的將時間因素考慮在內(nèi),各個時間點的生存率值也被稱為時點生存率。 線上有許多綠色的十字(有些圖線會略去他們,也是可以的),他們對應(yīng)的是刪失數(shù)據(jù)們的隨訪時間長度:
生存曲線呈現(xiàn)折線的樣子,每一個“臺階”都對應(yīng)著一個發(fā)生終點事件的時間點: 也就是每次有終點事件出現(xiàn)的時刻都會計算一次生存率,把他們用折線連接就構(gòu)成了生存曲線。 關(guān)鍵的問題來了,這個生存率是怎么算出來的呢? 在研究的起始處,生存率當然是100%啦:
我們接下來看第一個事件出現(xiàn)的時刻: 在這個事件發(fā)生時,共有12例患者處于觀察中,其中一人出現(xiàn)終點事件,死亡1/12=0.0833;生存11/12=0.9167,于是生存率就這樣計算出來啦:91.67%。 后面的點又該怎樣呢?我們來看第二個點吧:
在這個時段,共有11人堅持隨訪,其中一人發(fā)生終點事件,10人生存。故而生存概率為10/11=0.9091。由于這個時刻的生存情況實在上一個時間點的基礎(chǔ)上產(chǎn)生的,所以這個時點的累積生存率也要基于上一個時間點生存率計算,那就是: 0.9167X0.9091=83.33% 下面到了第三個事件發(fā)生的時刻:
第三個結(jié)局事件發(fā)生之前,已經(jīng)有一例刪失病例出現(xiàn),所以到這時,僅余9人在隨訪過程中,其中一人發(fā)生終點事件,生存8/9=0.8889。同樣的,基于前一時刻的生存率計算本時刻的累計生存率,就是: 0.8333X0.8889=74.07% 由此可見,Kaplan-Meier方法在計算生存率的過程中充分利用了刪失數(shù)據(jù)所提供的不完全信息。雖然我們不能知道這個病例會在什么時候發(fā)生終點事件,但是我們至少知道了在隨訪時間段內(nèi)這個病例是沒有發(fā)生終點事件的。所以在計算累計生存率的時候,在他的隨訪時間內(nèi)他被作為未發(fā)生結(jié)局的病例參與計算。刪失后則從觀察病例中移除。 如上往復(fù),我們可以獲得完整的生存曲線: 可見各時點的累計生存率,是由此前所有時點的生存概率連乘獲得的。所以這個推演生存率的方法還有一個很雅致的名字:乘積極限法。 綜上,生存曲線為我們描繪了結(jié)局事件的顯現(xiàn)過程,我們可以把它表達為隨著終點事件的出現(xiàn) ,生存率的下降: 或者改變縱坐標,表達為隨著時間推移,終點事件發(fā)生率逐漸增高的方式:
當然,也有機會對兩條或多條生存曲線給予直觀的描繪,還可以進一步通過假設(shè)檢驗表明其差異: 這就是生存曲線,并不復(fù)雜但相當有用。 |
|
|
來自: 三毛99 > 《基礎(chǔ)醫(yī)學》