小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

【SCI教程】因果關(guān)系的推導(dǎo)及一些相關(guān)的概念

 牤牛河畔生 2015-09-19

 

許多臨床研究的問題,尤其是病因?qū)W研究,危險因素的研究,往往涉及到因果關(guān)系的求證。例如紅斑狼瘡的遺傳學(xué)研究中,我們需要從多個的基因位點中篩選出哪個或那些與紅斑狼瘡有關(guān);臨床上,髖關(guān)節(jié)損害常常加速強直性脊椎炎致殘,我們可能想要了解哪些因素與強直性脊椎炎的髖關(guān)節(jié)損害有關(guān);我們還可能需要了解哪些抗風(fēng)濕藥可能會導(dǎo)致結(jié)締組織病的性腺功能衰竭;等等。因此,因果關(guān)系的推導(dǎo)是臨床研究中最基本的技能。嚴(yán)格地說,隨機對照試驗也是一種特定的因果關(guān)系推導(dǎo),上一講的預(yù)后因素分析也可以說是一種因果關(guān)系的推導(dǎo)。這里主要是簡要地討論病因?qū)W的研究,以及因果關(guān)系推導(dǎo)中一些有關(guān)的概念。

1.研究策略

推導(dǎo)因果關(guān)系主要應(yīng)用兩個分析性的研究策略,隊列研究和病例-對照研究。雖然描述性研究(病例組分析,橫斷面研究等)也可以在某些情況下提示可能存在因果關(guān)系,但主要是用于建立因果關(guān)系的假說,驗證假說一般需要分析性研究,即隊列研究和病例-對照研究。本刊過去一些相關(guān)的文章已討論過隊列研究和病例-對照研究的區(qū)別[1],上一講也介紹了隊列研究的方法[2]。這里主要討論病例-對照研究的基本方法。

病例-對照研究是一種回顧性的研究,首先需要選擇一個病例組和一個對照組,回顧兩組研究個體對研究因素的暴露情況。與隊列研究一樣,需要結(jié)合專業(yè)知識,盡量將各種可能有關(guān)的因素,均納入研究因素。一方面不遺漏有意義的病因,另一方面可以通過多元回歸等方法篩選和校正各因素之間的相互混雜。病例-對照研究特別適合于發(fā)病率較低的疾病的病因?qū)W研究。但是需注意在兩個研究組的樣本選擇時避免偏倚,對照組往往要求與病例組是同一人群中的非患病者。作病例-對照研究時,研究者需時時警惕和采取措施防止偏倚的存在[3]。

病例-對照研究的優(yōu)點在于(1)在分析性研究中,病例-對照研究是最節(jié)省時間和費用的研究策略;(2)尤其適用于發(fā)病率較低的病因?qū)W研究;(3)適合于潛伏期較長的病變的病因?qū)W研究;(4)可以對一個病進行病因?qū)W的多因素分析;(5)可以用優(yōu)勢比(OR值)間接反映暴露因素對疾病的危險性。然而其缺點包括(1)如果暴露是一個罕見的因素,通常難以達(dá)到滿意的研究結(jié)果;(2)它通常只限一個研究結(jié)局;(3)研究資料不能直接得出發(fā)病率和危險度;(4)很難確立暴露因素與疾病之間的時間關(guān)系;(5)與其它分析性研究相比,病例-對照研究較容易出現(xiàn)偏倚,尤其是在病例組和對照組的選擇、暴露狀況的回憶、分組錯誤和生存狀態(tài)等方面的偏倚。

2.相關(guān)強度計算

由于病例-對照研究的病例組和對照組是人為選定的,不能夠直接計算暴露者和非暴露組的發(fā)病率,因此它不能象隊列研究那樣直接計算相關(guān)危險度(RR值),其相關(guān)強度計算是通過比較病例組和對照組的暴露優(yōu)勢,計算優(yōu)勢比(OR值)。通過圖1的四格表計算,病例組暴露優(yōu)勢 = a/c,對照組暴露優(yōu)勢 = b/d,OR值=病例組暴露優(yōu)勢/對照組暴露優(yōu)勢 = ad/bc


3.多因素分析方法

因果關(guān)系的研究往往涉及到多個因素,病變的產(chǎn)生不是孤立的,各因素之間往往相互影響,可以相互協(xié)同或拮抗,也可以相互混雜。我們需要從許多的因素中篩選出對病變有影響的因素,還需要校正各因素之間的相互混雜,所以需要采用多因素分析的方法。不少已發(fā)表的論文,只用卡方檢驗進行單因素分析,雖然不能說有原則性的錯誤,但如果能增加多因素分析的方法進行篩選,可以校正混雜因素的影響,結(jié)果將會可靠得多。由于多因素之間的相互混雜,在單因素分析中,一些有意義的因素可能被埋沒了,而另一些沒有意義的因素又被夸大了[3]。

在病例-對照研究中,最常用的多因素分析方法是建立Logistic回歸模型時。在建立回歸模型時,要先對各個研究因素進行單因素分析。對于連續(xù)性的數(shù)值變量(如年齡)和有明確等級關(guān)系的有序分類變量(如尿蛋白半定量),可以直接進行回歸分析;無序分類變量(如血型)和等級關(guān)系不太明確的有序分類變量(如狼瘡性腎炎的WHO病理分型),則須采用分層回歸分析的方法。

有時我們可能想要證實某兩個或多個因素合在一起時,對結(jié)局的影響有無協(xié)同或拮抗作用。如某多元回歸分析初步顯示,高血壓和頑固性蛋白尿是狼瘡性腎炎預(yù)后的危險因素,如果你想了解二者有無協(xié)同作用,可以將二者相乘合并為一個變量,與原來的兩個變量一起放入回歸方程中去篩選,如果方程能接受這個新的變量,則提示這兩個變量具有協(xié)同作用。

單因素分析一方面可初步篩選出可能與預(yù)后有關(guān)的因素;另一方面去除那些根本不可能相關(guān)的因素,以減少建立多元回歸模型時的“壓力”。習(xí)慣上,人們多將單因素分析中P值≤0.2的因素,以及雖然P值>0.2,但結(jié)合專業(yè)知識可能有關(guān)的因素,均作為待選變量引入到回歸方程中去篩選。在建立多元回歸方程時,待選變量的標(biāo)準(zhǔn)應(yīng)該放寬一些,以免遺漏那些由于混雜的影響,導(dǎo)致在單因素分析中被“埋沒”的有意義的因素。前幾個月閱讀某期刊2001年初發(fā)表的一篇有關(guān)狼瘡腦病發(fā)生的相關(guān)因素分析,只對單因素分析中P值<0.05者進行多因素回歸分析,結(jié)果只有血白細(xì)胞,尿紅細(xì)胞和A/G比值3個因子進入Logistic回歸方程,被認(rèn)為是與紅斑狼瘡腦病發(fā)生的相關(guān)因素。從風(fēng)濕病專業(yè)的角度,估計很少有風(fēng)濕科醫(yī)生能接受這一研究結(jié)果。分析其原因,可能是在建立多元回歸方程時,待選變量的標(biāo)準(zhǔn)太嚴(yán),導(dǎo)致真正有意義的因素被“埋沒”。最近又見一篇狼瘡性腎炎預(yù)后分析的文章,同樣只取單因素分析有意義的變量進行多元回歸分析。可見這種錯誤不是個別現(xiàn)象。

Logistic回歸的運算公式不在此討論,一方面限于篇幅,另一方面回歸分析一般都用計算機統(tǒng)計軟件進行運算,幾乎沒有人采用計算公式進行運算。作為臨床醫(yī)生,只需掌握建立數(shù)據(jù)庫的方法,學(xué)會某一統(tǒng)計軟件包的操作,看得懂計算機運算結(jié)果中有用的參數(shù),并會將所需要的參數(shù)(如:OR值及其95%可信區(qū)間,P值等)引用到論文中,以及能解析這些結(jié)果的意義就可以了。至于運算公式的推導(dǎo),那是統(tǒng)計學(xué)家的事情。

4.OR值與RR值的區(qū)別

OR值和RR值是兩個意義相似,又有區(qū)別的統(tǒng)計量。如果其值>1,提示“因”促進“果”的發(fā)生;<1 提示“因”阻止“果”的發(fā)生;=1 則“因”與“果”無關(guān)。病例-對照研究只能計算OR值,不能計算RR值;而隊列研究既可計算RR值,又可計算OR值。Logistic回歸計算OR值,COX回歸計算RR值。

曾見本刊有文章以病例-對照研究的方法采集研究樣本,結(jié)果錯誤地運算RR值,而不是OR值。這幾年審稿時,遇見數(shù)篇類似的錯誤,建議文章修改時改算OR值及其95%可信區(qū)間,可是文章發(fā)表出來只刪去了RR值,改用簡單的卡方檢驗。為了提高本刊的質(zhì)量,建議國內(nèi)同行在必要時,與臨床流行病學(xué)或統(tǒng)計學(xué)的老師溝通一下,避免出現(xiàn)這種一目了然的錯誤。也不要為了“避免錯誤”,而只作卡方檢驗,不計算OR值或RR值。中華醫(yī)學(xué)會雜志社一再要求,文章“不應(yīng)盲目套用卡方檢驗”[4]。

RR值的含義是,如果研究因素為暴露和非暴露兩種情況,則暴露于某因素的人發(fā)生某病的概率為非暴露者的(RR)倍;如果研究因素為連續(xù)性數(shù)值,則研究因素每增加1個單位,發(fā)生某病的概率增加(RR-1)倍。病例-對照研究是由“果”推論到“因”的研究,即研究樣本是由病例組和對照組開始,不存在暴露組與非暴露組,因此不能計算發(fā)病率,也就不可能計算RR值,只能計算OR值。即比較病例組和對照組的對研究因素的暴露優(yōu)勢,以此來估計相對危險度的大小。在發(fā)病率較低,樣本量較大的病因?qū)W研究中,OR值與RR值的含義幾乎相同。如前面的四格表中,RR= a/(a+b)÷c/(c+d),如果樣本量足夠大,而發(fā)病率較小,則(a+b)中的a和(c+d)中的c可以忽略不計,這樣RR=a/(a+b)÷c/(c+d)≈a/b÷c/d=ad/bc=OR。但是在陽性結(jié)局發(fā)生率較高的病因?qū)W研究和預(yù)后研究中,由于RR值公式中的a和c不能被忽略,所以O(shè)R值不能被視為RR值。

5.可信區(qū)間的重要性

在國內(nèi)醫(yī)學(xué)期刊中,僅少數(shù)的臨床研究論文對相關(guān)強度的運算結(jié)果給出了95%可信區(qū)間,其實多數(shù)論文在其統(tǒng)計學(xué)方法中已闡明是調(diào)用計算機統(tǒng)計軟件完成,而幾乎所有統(tǒng)計軟件在計算RR值或OR值時,已自動給予了它們的95%可信區(qū)間,論文作者只需“一舉手之勞”,就可以使文章“提高一個檔次”,可惜許多發(fā)表的論文缺少了這一重要的內(nèi)容。早在80年代中期,《BritishMedical Journal》就已發(fā)表文章“Confidenceintervals rether than P values: estimation rather than hypothesis testing”,強調(diào)可信區(qū)間的重要性[5]。國際上重要醫(yī)學(xué)期刊的臨床研究論文中,涉及到這類統(tǒng)計量時,也幾乎均有交代95%可信區(qū)間。

95%可信區(qū)間與P值在一定程度上有共同之處,如果RR值和OR值的95%可信區(qū)間包含了1,回歸系數(shù)的95%可信區(qū)間包含了0,兩個均數(shù)的95%可信區(qū)間有重疊,均表示它們假設(shè)檢驗的P值>0.05。不時會見到一些已發(fā)表風(fēng)濕病學(xué)的論文,RR值的95%可信區(qū)間包含了1,P值卻<0.05,提請注意。

但是,P值不能反映可信區(qū)間,假設(shè)檢驗不能代替范圍估計。因為P值只給人們“全或無”的信息,P值<0.05被認(rèn)為有統(tǒng)計學(xué)意義,>0.05則無統(tǒng)計學(xué)意義。這樣,有實際意義的差異往往因為樣本量不足被判為無統(tǒng)計學(xué)意義(如圖2中的C);沒有實際意義的微小差異則可能因為大樣本量而被顯示出有統(tǒng)計學(xué)意義(如圖2中的B)。另外,單純提供P值,還可能培養(yǎng)讀者的懶惰思維,盲目地聽信統(tǒng)計學(xué)意義??尚艆^(qū)間給讀者一個范圍的估計,可讓臨床醫(yī)生在閱讀文獻(xiàn)時,結(jié)合專業(yè)的知識進行取舍。論文作者也需要結(jié)合專業(yè)知識在討論中對論文的結(jié)果進行討論,以得出研究的結(jié)論,此時可信區(qū)間往往會被作為討論的依據(jù)。

圖2顯示假設(shè)檢驗與95%可信區(qū)間的關(guān)系:縱坐標(biāo)向上,表示差異增大,P值漸?。弧盁o效假設(shè)”的橫坐標(biāo)實線為RR值或OR值=1,回歸系數(shù)=0,或P值=0.05;橫坐標(biāo)虛線為實際意義。A和B表示有統(tǒng)計學(xué)意義,P值<0.05,但A既有統(tǒng)計學(xué)意義,又有實際意義;B只有統(tǒng)計學(xué)意義,沒有實際意義。C和D表示無統(tǒng)計學(xué)意義,P值>0.05,但C還不能確定是否真的沒有實際意義;D則真的是沒有意義。因此,臨床醫(yī)生引用文獻(xiàn)的結(jié)果來指導(dǎo)臨床決策時,需要參考可信區(qū)間,而不能盲目追求P值。


 



    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多