|
兩兩比較方法的選擇,大概是統(tǒng)計(jì)學(xué)界爭(zhēng)議最多的一個(gè)話題了,直至今天,也沒(méi)有一個(gè)完全統(tǒng)一的說(shuō)法。所以,本文雖然說(shuō)是兩兩比較方法的選擇,但更多的是在基于以往文獻(xiàn)的基礎(chǔ)上,再結(jié)合作者本人的經(jīng)驗(yàn)和理解,給讀者一些提示。 兩兩比較的方法太多了,正因?yàn)樘嗔耍酝蠹叶疾恢澜o怎么選擇。比如SAS提供了12種兩兩比較方法讓人選擇,SPSS更是毫不吝嗇地給出了18種方法讓你選擇。我想任何一個(gè)非統(tǒng)計(jì)專(zhuān)業(yè)的人都有同一個(gè)感覺(jué):你在耍我們嗎?毫無(wú)提示地給出10多種方法,讓我一個(gè)毫無(wú)統(tǒng)計(jì)背景的人自己選擇。就像是醫(yī)生給你10多種藥,一臉憐憫地對(duì)你說(shuō):回家自己看著吃啊,你覺(jué)得哪個(gè)好就吃哪個(gè)。 關(guān)鍵是,明知道我們沒(méi)有這個(gè)判別力,為什么要給我們這么多的兩兩比較方法,還得讓我們自己選擇?正是統(tǒng)計(jì)學(xué)家太多了,每個(gè)人都能根據(jù)自己的理念提出一種方法,而這些方法看起來(lái)似乎都沒(méi)錯(cuò),那怎么辦?只好都放在軟件中,你自己跟著感覺(jué)走吧。 下面就來(lái)說(shuō)幾種比較常見(jiàn)的兩兩比較方法的選擇,希望給大家稍微理清一點(diǎn)思路。先聲明一下,以下結(jié)論是參考了不少國(guó)外課本和文獻(xiàn),加上自己的一點(diǎn)經(jīng)驗(yàn),而且只給出結(jié)論性的內(nèi)容,不給出公式和證明,喜歡追根究底的朋友可以自己看專(zhuān)業(yè)書(shū)籍。 為什么要用兩兩比較方法呢?大多數(shù)兩兩比較方法的目的都是為了控制假陽(yáng)性,因?yàn)閮蓛杀容^次數(shù)多了,容易產(chǎn)生假陽(yáng)性的結(jié)果。 首先說(shuō)醫(yī)學(xué)統(tǒng)計(jì)課本中最喜歡介紹的3種方法:LSD、SNK和Bonferroni法。我大概翻了一下國(guó)內(nèi)的醫(yī)學(xué)統(tǒng)計(jì)學(xué)教程,幾乎都是這3種方法,但似乎都沒(méi)有說(shuō)什么情況下用。 LSD法其實(shí)就相當(dāng)于t檢驗(yàn),只不過(guò)它需要在方差分析一定要有統(tǒng)計(jì)學(xué)差異的情況下才用。所以LSD法并沒(méi)有控制假陽(yáng)性錯(cuò)誤。一般情況下,如果你在設(shè)計(jì)初期就有很明確的目的,可以考慮這種方法,因?yàn)槊恳粚?duì)比較都是有特定意義的,不用非得控制假陽(yáng)性錯(cuò)誤。 SNK法是先按多組均值大小排序,然后按一個(gè)有點(diǎn)類(lèi)似于t檢驗(yàn)的公式分別比較(不過(guò)誤差計(jì)算不同)。比如a、b、c三組均值分別是a最小,c最大,b居中。那么比較時(shí),很顯然a和c差別最大,所以在最后的界值上做一些調(diào)整。例如,原來(lái)可能t檢驗(yàn)的界值是2.83,只要t值大于2.83就算有差異,現(xiàn)在把界值調(diào)大,比如調(diào)到3.40,a和c的比較計(jì)算的t值,只有大于3.4才算有差異。這種調(diào)整的界值叫做q界值。這種方法對(duì)假陽(yáng)性錯(cuò)誤的控制依然不到位。所以如果你想控制假陽(yáng)性,不要選這種方法。 Bonferroni法大概是最流行的一種方法,因?yàn)楹?jiǎn)單。它的思想是調(diào)整檢驗(yàn)水準(zhǔn),根據(jù)比較的次數(shù)重新設(shè)定檢驗(yàn)水準(zhǔn),然后根據(jù)P值做出結(jié)論。比如常規(guī)的檢驗(yàn)水準(zhǔn)是0.05,只要P小于0.05就認(rèn)為有統(tǒng)計(jì)學(xué)差異。但是如果用Bonferroni法調(diào)整,則需要0.05除以比較次數(shù),如比較6次,這時(shí)調(diào)整后的檢驗(yàn)水準(zhǔn)是0.05/6=0.0083,也就是說(shuō),P值小于0.0083才算有差異。這種方法其實(shí)更像是一種檢驗(yàn)水準(zhǔn)調(diào)整方法,簡(jiǎn)單易用,不僅可以用于均值的兩兩比較,也可用于率的兩兩比較。比如你要做三組的卡方檢驗(yàn),想進(jìn)一步兩兩比較,就可以考慮用這種方式,即分別做兩組的卡方,但是一共比較3次,所以P值小于0.0167才算有差異。這種方法的缺點(diǎn)是,當(dāng)比較次數(shù)多時(shí),結(jié)果過(guò)于保守,比如比較10次,那就需要P值小于0.005才算有差異,有時(shí)很難達(dá)到。 再說(shuō)點(diǎn)其它國(guó)內(nèi)課本上不大介紹但是國(guó)外介紹比較多的幾種方法。 下面這兩種方法一般用于各組之間例數(shù)相等的情形。 Tukey法,有時(shí)也叫Tukey HSD法(Honestly Significant Difference test)。這種方法大概是統(tǒng)計(jì)學(xué)家最認(rèn)可一致的方法了,絕大多數(shù)統(tǒng)計(jì)學(xué)家都相信,Tukey法的檢驗(yàn)效率可能是最高的。Tukey法也是基于q檢驗(yàn),大概意思是先確定一個(gè)最大差異的臨界值,然后分別對(duì)其中兩組比較,看看哪兩組差值大于這個(gè)界值,就算有差異。Tukey法是大多數(shù)統(tǒng)計(jì)學(xué)家首先推薦的兩兩比較方法,不過(guò)這種方法只適用于組間例數(shù)相等的情況。對(duì)于組間例數(shù)不等的時(shí)候,可用修正的Tukey法,也叫作Tukey-Kramer法。 與Tukey法效率差不多的大概是REGWQ法(不要奇怪這個(gè)名字,每個(gè)字母代表一個(gè)人名,Ryan,Einot,Gabriel ,Welsch;Q表示方法)。REGWQ法與Tukey法都對(duì)假陽(yáng)性錯(cuò)誤控制的比較好。這種方法一般也只用于各組例數(shù)相等的情況。 下面這幾種方法一般可用于各組例數(shù)不等的情形。 如果各組例數(shù)雖然不同,但差的并不大,可以考慮用Gabriel 檢驗(yàn),這種情況下一般效率較高,但如果組間的例數(shù)差別較大,一般不要采用這種方法,否則容易結(jié)果不穩(wěn)定。 當(dāng)各組例數(shù)差別較大時(shí),Hochberg's GT2法效率較高,這種方法的思路與Tukey法有點(diǎn)類(lèi)似,只不過(guò)采用的界值不同。這種方法的效率不如Tukey法,尤其在組間例數(shù)相等時(shí),它的效率一直不如Tukey法,但與Gabriel的效率基本相當(dāng)。但在組間例數(shù)相差懸殊的時(shí)候,可以考慮這種方法。但是如果各組方差相差較大,這種方法很不可靠。 Scheffe法在國(guó)外用的也比較多,該法效率也非常高。大概是僅次于Tukey法。有時(shí)候你可能會(huì)遇到這種情況:方差分析有統(tǒng)計(jì)學(xué)意義,而兩兩比較卻發(fā)現(xiàn)任何兩組都沒(méi)有差異。這時(shí)候用Scheffe法通常不會(huì)出現(xiàn)這種尷尬的場(chǎng)面。 其它情形下的一些方法: Dunnett檢驗(yàn)是一種比較特殊的檢驗(yàn),它不是用于兩兩比較,而是某些固定的比較。通常情況下是,如果有一個(gè)對(duì)照組,多個(gè)試驗(yàn)組,多個(gè)試驗(yàn)組之間不做比較,但是每個(gè)試驗(yàn)組分別與對(duì)照組作比較,這時(shí)候就選擇用Dunnett法。這種比較方式通常都是在研究設(shè)計(jì)階段就設(shè)定好的。 如果各組之間方差差別較大,通??煽紤]用Games-Hotwell檢驗(yàn),這種方法在方差不等時(shí)可以提供更有高的效率,而且允許各組例數(shù)不等。但如果每組例數(shù)較小,這種方法容易不穩(wěn)定。 最后的個(gè)人小結(jié)(僅代表個(gè)人觀點(diǎn)): 如果各組例數(shù)相等,建議首選Tukey法;如果例數(shù)不等,建議首選Scheffe法(如果比較組數(shù)不多,如3組,Bonferroni法也可以作為首選);如果要分別比較每個(gè)試驗(yàn)組與對(duì)照組,建議采用Dunnett法;如果各組方差相差較大,建議采用Games-Hotwell法。 事實(shí)上,每一種兩兩比較方法都有自己的道理,真正在發(fā)表文章時(shí),除非方法本身有特定的要求(比如Tukey法只能用于組間例數(shù)相等的情形),其實(shí)你采用哪種方法可能都不能說(shuō)錯(cuò)。有時(shí)需要結(jié)合自己的研究計(jì)劃和研究目的,比如從藥監(jiān)局的角度,肯定更側(cè)重控制假陽(yáng)性率,從其它不同角度可能有不一樣的目的,這些都可以作為選擇的參考。 |
|
|
來(lái)自: zpdeng > 《科學(xué)研究》