小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

畫說統(tǒng)計 | 生存分析之Kaplan-Meier曲線都告訴我們什么

 三毛99 2017-06-26

      面對這樣的數(shù)據(jù)該如何統(tǒng)計分析呢?辦法當然有,由于最初這類方法被應(yīng)用于針對死亡結(jié)局的分析中,所以這類分析被稱為:生存分析。其中,Kaplan-Meier方法是幫助我們描述生存結(jié)局(或者說,終點事件)發(fā)生情況的有效手段。

        為了方便理解,我們首先回顧一下這類研究的過程。已疾病死亡為例。


       我們用橫軸表達研究的時間軸,隨著研究的開始,患者開始納入研究:


    隨著時間的推移,越來越多的患者加入到研究中:


       繼續(xù)我們的觀察,開始有患者出現(xiàn)了我們所期待的終點事件,像這樣獲得了終點事件的觀察數(shù)據(jù)我們稱其為完全數(shù)據(jù)


      當然,也有患者在沒有出現(xiàn)所期待的終點事件的情況下離開研究(比如失訪的患者)。此類未能獲得終點事件發(fā)生情況的數(shù)據(jù)我們稱之為刪失數(shù)據(jù)


       隨著時間推移,越來越多的患者出現(xiàn)了所期待的終點事件,當然也有不少人悄悄離開:


      當然,到了研究結(jié)束的時刻,也一定還有對我們不離不棄但一直沒有出現(xiàn)預(yù)期終點事件的患者不得不離開研究:


      面對這樣的數(shù)據(jù)我們應(yīng)該如何描述他的生存特征呢?很顯然,如果我們僅僅把患者按照是否觀察到預(yù)期的終點事件分為兩類顯然是不公平的:

       因為刪失病例完全有可能因為觀察時間的不足而導(dǎo)致未來得及發(fā)生期待的終點事件。從終點事件的觀察角度看,刪失數(shù)據(jù)的信息是不完整的,我們并不知道這樣的病例會在什么時刻發(fā)生我們期望看到的終點事件而僅僅知道在他的隨訪時間內(nèi),這個病例沒有出現(xiàn)期待的終點事件


     在這種情況下,采用生存分析方法才是合理的選擇。 其中,Kaplan-Meier方法是幫助我們描述終點事件發(fā)生率的有效手段。

     要怎么做呢?

     首先,我們需要把所有研究對象按照隨訪時間的長度整齊排列(當然不用手工完成,有軟件在,我們明白道理就好):

      然后繪制曲線。

      怎么畫出來的,一會兒再說。我們先看看曲線都告訴我們什么:他的橫軸是時間,縱軸是生存率:

       也就是說Kaplan-Meier曲線為我們描畫了患者生存率隨時間變化的特征。他完美的將時間因素考慮在內(nèi),各個時間點的生存率值也被稱為時點生存率


        線上有許多綠色的十字(有些圖線會略去他們,也是可以的),他們對應(yīng)的是刪失數(shù)據(jù)們的隨訪時間長度:

   

       生存曲線呈現(xiàn)折線的樣子,每一個“臺階”都對應(yīng)著一個發(fā)生終點事件的時間點:

        也就是每次有終點事件出現(xiàn)的時刻都會計算一次生存率,把他們用折線連接就構(gòu)成了生存曲線。


        關(guān)鍵的問題來了,這個生存率是怎么算出來的呢?

        在研究的起始處,生存率當然是100%啦:

 

      我們接下來看第一個事件出現(xiàn)的時刻:

       在這個事件發(fā)生時,共有12例患者處于觀察中,其中一人出現(xiàn)終點事件,死亡1/12=0.0833;生存11/12=0.9167,于是生存率就這樣計算出來啦:91.67%。


       后面的點又該怎樣呢?我們來看第二個點吧:

       在這個時段,共有11人堅持隨訪,其中一人發(fā)生終點事件,10人生存。故而生存概率為10/11=0.9091。由于這個時刻的生存情況實在上一個時間點的基礎(chǔ)上產(chǎn)生的,所以這個時點的累積生存率也要基于上一個時間點生存率計算,那就是:

0.9167X0.9091=83.33%


       下面到了第三個事件發(fā)生的時刻:

        第三個結(jié)局事件發(fā)生之前,已經(jīng)有一例刪失病例出現(xiàn),所以到這時,僅余9人在隨訪過程中,其中一人發(fā)生終點事件,生存8/9=0.8889。同樣的,基于前一時刻的生存率計算本時刻的累計生存率,就是: 

0.8333X0.8889=74.07%


       由此可見,Kaplan-Meier方法在計算生存率的過程中充分利用了刪失數(shù)據(jù)所提供的不完全信息。雖然我們不能知道這個病例會在什么時候發(fā)生終點事件,但是我們至少知道了在隨訪時間段內(nèi)這個病例是沒有發(fā)生終點事件的。所以在計算累計生存率的時候,在他的隨訪時間內(nèi)他被作為未發(fā)生結(jié)局的病例參與計算。刪失后則從觀察病例中移除。


        如上往復(fù),我們可以獲得完整的生存曲線:

        可見各時點的累計生存率,是由此前所有時點的生存概率連乘獲得的。所以這個推演生存率的方法還有一個很雅致的名字:乘積極限法。


        綜上,生存曲線為我們描繪了結(jié)局事件的顯現(xiàn)過程,我們可以把它表達為隨著終點事件的出現(xiàn) ,生存率的下降:


        或者改變縱坐標,表達為隨著時間推移,終點事件發(fā)生率逐漸增高的方式:

  

       當然,也有機會對兩條或多條生存曲線給予直觀的描繪,還可以進一步通過假設(shè)檢驗表明其差異:

 

            這就是生存曲線,并不復(fù)雜但相當有用。



    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多