多個(gè)均值之間的多重比較
在完成方差分微得知某因素對(duì)觀測(cè)結(jié)果的影響顯著時(shí),僅表明該因素的各水平下的均數(shù)之間的差別總體上是顯著的,并不知道任何2個(gè)均數(shù)之間的差別是否顯著(此時(shí),即使在多數(shù)場(chǎng)合下,可認(rèn)為均數(shù)的最大值與最小值之間的差別顯著,但卻不知p值的大?。?。當(dāng)實(shí)際工作者希望進(jìn)一步知道更為詳細(xì)的情況時(shí),就需要在多個(gè)均數(shù)之間進(jìn)行多重比較。然而,根據(jù)所控制誤差的類型和大小不同,便產(chǎn)生了許許多多的多重比較法。
設(shè)某因素有10個(gè)水平,若采用通常的t檢驗(yàn)進(jìn)行多重比較,共需比較的次數(shù)為∶C210=45次,即使每次比較時(shí)都把α控制在0.05水平上(即令CER=0.05),但此時(shí)EER=1-(1-0.05)45=0.90,這表明作完45次多重比較后,所犯Ⅰ型錯(cuò)誤的總概率可達(dá)到0.90,事實(shí)上,選用t檢驗(yàn)進(jìn)行多重比較,僅僅控制了CER,卻大大地增大了EER!
1.兩兩比較
(1)僅控制CER(比較誤差率)的方法
①T法(即成組比較的t檢驗(yàn)法,但誤差的均方不是由所比較的2組數(shù)據(jù)、而是由全部數(shù)據(jù)算得的)注意∶用此法所作比較的次數(shù)越多,其EER(試驗(yàn)誤差率)就越大。
②LSD法:也叫最小顯著差數(shù)法,只用于2組例數(shù)相等的場(chǎng)合LSD的值被稱為Fisher的最小顯著差.注意∶用此法所作比較的次數(shù)越多,其EER(試驗(yàn)誤差率)就越大。
③DUNCAN法
(2)控制MEER(最大試驗(yàn)誤差率)的方法
①BON法(即Bonferroni t檢驗(yàn)法)
它令CER=ε=α/C,這里C為比較的總次數(shù),當(dāng)因素有K個(gè)水平時(shí),則C=K(K-1)/2,下同。
②SIDAK法(根據(jù)Sidak的不等式進(jìn)行校正的t檢驗(yàn)法)
③SCHEFFE法
它是由Scheffe于1953和1959年提出的另一種控制MEER的法,
Scheffe檢驗(yàn)的結(jié)果與先作的方差分析的結(jié)果是相容的,即若ANOVA的結(jié)果是顯著,用此法至少能發(fā)現(xiàn)一次比較的結(jié)果是顯著的,反之,若ANOVA的結(jié)果為不顯著,用此法也找不出任何2個(gè)均數(shù)之間有顯著差別來(然而,大部分多重比較法則可能會(huì)發(fā)現(xiàn)有顯著差別的對(duì)比組)。
如果比較的次數(shù)明顯地大于均數(shù)的個(gè)數(shù)時(shí),Scheffe法的檢驗(yàn)功效可能高于BON法和SIDAK法。對(duì)于兩兩比較,一般來說,Sidak t法的檢驗(yàn)功效高。
④TUKEY法(也稱為Tukey或Tukey-Kramer法)
Tukey(1952,1953)以學(xué)生化極差為理論根據(jù),提出了專門用于兩兩比較的檢驗(yàn)(有時(shí)也稱為誠實(shí)(或最大)顯著差檢驗(yàn))。當(dāng)各組樣本含量相等時(shí),此檢驗(yàn)控制MEER;當(dāng)樣本含量不等時(shí),Tukey(1953)和Kramer(1956)分別獨(dú)立地提出修正的方法。對(duì)Tukey-Kramer法控制MEER沒有一般的證明,但Dunnett(1980)用蒙特卡洛法研究發(fā)現(xiàn)此法非常好。此法的檢驗(yàn)功效高于BON法、SIDSAK法或SCHEFFE法。
⑤GT2法或SMM法
它是有Hochberg(1974)推導(dǎo)嘗且與Tukey法像似的一種方法,它用學(xué)生化最大模數(shù)取代學(xué)生化極差,并運(yùn)用Sidak(1976)的未校正的t不等式。在樣本含量相等時(shí),已證明此法把MEER控制在不超過α的水平上。一般認(rèn)為,此法的檢驗(yàn)功效低于Tukey-Kramer法,并且,在樣本含量相等時(shí),此法的檢驗(yàn)功效總低于Tukey檢驗(yàn)。若式(2.5.5)成立,則宣稱所比較的2均數(shù)之間的差別顯著。
⑥GABRIEL法
它是由Gabriel(1978)提出的,用于樣本含量不等時(shí)的一種多重比較法。此法建立于學(xué)生化最大?;A(chǔ)之上。
樣本含量相等時(shí),Gabriel檢驗(yàn)與Hochberg檢驗(yàn)是等階的;樣本含量不等時(shí),Gabriel法比GT2法具有更高的檢驗(yàn)功效,但當(dāng)樣本含量相差懸殊時(shí),此法可能變得不精確。
⑦REGWQ法和REGWF法(詳見“多級(jí)檢驗(yàn)”)
2.多級(jí)檢驗(yàn)(MSTs─Multiple-Stage Test)
使用多級(jí)檢驗(yàn)可以獲得同時(shí)檢驗(yàn)的更高功效。MSTs分為步長(zhǎng)增加法和步長(zhǎng)減少法,步長(zhǎng)減少法一直被用得較廣泛,SAS/STAT中采用的也是此法。
設(shè)某顯著因素有K個(gè)水平,即有K個(gè)均數(shù)需要比較,則步長(zhǎng)減少的MSTs法的檢驗(yàn)步驟為∶
第1步∶將均數(shù)由大到小排隊(duì),即X-1≥X-2≥…≥X-k;
第2步∶比較X-1與X-k。此時(shí)是跨度(即一般統(tǒng)計(jì)書中所說的處理數(shù))為K級(jí)的2個(gè)均數(shù)之間的比較,若兩者之間差別不顯著,則意味著其他任何2個(gè)均數(shù)之間的差別也都不顯著,應(yīng)停止一切比較;反之,則進(jìn)行下面的第3步;
第3步∶比較X-1與X-k-1、X-2與X-k。此時(shí)是跨度為K-1級(jí)的2個(gè)均數(shù)之間的比較,沿用第2步后面的思路,一直進(jìn)行下去,如果每一步都有不滿足停止比較的對(duì)比組,最后應(yīng)達(dá)到跨度為2的所有需要比較的相鄰2均數(shù)間都作完比較時(shí)為止。
MSTs法在作每一級(jí)比較時(shí),通過控制γa的水平(a=K,K-1,…,2)來實(shí)現(xiàn)其最終要控制的某種誤差率。γa在特定的中所起的作用相當(dāng)于t和F分中的概率α,即γa也是一種顯著性水平,它與對(duì)比的2個(gè)均數(shù)之間的跨度(即處理數(shù)a)有關(guān)。在MSTs中,最著名的2種方法分別是DUNCAN法和SNK法,這2種方法及其主要區(qū)別如下∶
(1)DUNCAN法(常稱為新多極差檢驗(yàn)法、SSR法)
此法控制的是Ⅰ型比較誤差率CER=α(即每作1次比較所對(duì)應(yīng)的犯Ⅰ型錯(cuò)誤的概率為α),而不是試驗(yàn)誤差率MEER。為實(shí)現(xiàn)此目標(biāo),它所對(duì)應(yīng)的γa=1-(1-α)a-1。有些研究結(jié)果表明,
如果不考慮較高的Ⅰ型誤差率,那么,此法優(yōu)于Tukey法。在都是控制CER的3種法中,SAS寧愿推薦LSD法或T法,因?yàn)樗鼈円子谟?jì)算和解釋。DUNCAN法的檢驗(yàn)統(tǒng)計(jì)量為q,當(dāng)式(2.5.7)成立時(shí),則宣稱所比較的2均數(shù)之間差別顯著。
如果是用手工計(jì)算,需查DUNCAN檢驗(yàn)用的q臨界值表得到q的臨界值。
(2)SNK法(稱為多極差檢驗(yàn)法或Student-Newman-Keuls法或q檢驗(yàn)法)
此法控制的是EERC=α,為實(shí)現(xiàn)此目標(biāo),它所對(duì)應(yīng)的γa=α。值得注意的是SAS并不推薦使用此方法,因?yàn)樗a(chǎn)生的MEER相當(dāng)大,尤其是在比較的次數(shù)C很大時(shí),MEER將趨近于1。
控制MEER的另2種MSTs法不像SNK法和DUNCAN法那樣出名,但它們卻是到本世紀(jì)七十年代為止的文獻(xiàn)中介紹的最有效的步長(zhǎng)減少的MSTs法,它們是REGWQ法和REGWF法,由Ryan(1959,1960)、Einot和Gabriel(1975)和Welsch(1977)研究出來,
(3)REGWQ法 (4)REGWF法
?。常甒ALLER法(即貝葉斯法)
該法由Waller和Duncan(1969)采用,它不是控制Ⅰ型誤差率,而是在附加損失條件下使貝葉斯風(fēng)險(xiǎn)達(dá)到最小值。該法的假定條件是∶各組總體均數(shù)具有未知方差的先驗(yàn)正態(tài),均數(shù)的方差的對(duì)數(shù)具有先驗(yàn)均勻。
4. DUNNETT法(即所有處理組均數(shù)分別與對(duì)照組均數(shù)比較)
DUNNETT檢驗(yàn)控制MEER在不超過事先給定的α水平上。