|
學(xué)習(xí)教育統(tǒng)計(jì)中,對(duì)自由度的概念不甚了解,故求助于baidu。
自由度,很多統(tǒng)計(jì)量的計(jì)算公式中都有自由度的概念,可為什么同樣是計(jì)算標(biāo)準(zhǔn)差,總體標(biāo)準(zhǔn)差的自由度是n,而樣本標(biāo)準(zhǔn)差的自由度就是n-1?為什么其它公式中的自由度還有n-2、n-3呢? 它到底是什么含意?
翻看了以前的教材以及到網(wǎng)上查閱了大量相關(guān)資料,原來(lái),不僅僅是統(tǒng)計(jì)學(xué)里有自由度的概念呀!下面把有關(guān)自由度的問(wèn)題點(diǎn)簡(jiǎn)要?dú)w納一下。 理論力學(xué):確定物體的位置所需要的獨(dú)立坐標(biāo)數(shù)稱(chēng)作物體的自由度,當(dāng)物體受到某些限制時(shí)——自由度減少。一個(gè)質(zhì)點(diǎn)在空間自由運(yùn)動(dòng),它的位置由三個(gè)獨(dú)立坐標(biāo)就可以確定,所以質(zhì)點(diǎn)的運(yùn)動(dòng)有三個(gè)自由度。假如將質(zhì)點(diǎn)限制在一個(gè)平面或一個(gè)曲面上運(yùn)動(dòng),它有兩個(gè)自由度。假如將質(zhì)點(diǎn)限制在一條直線(xiàn)或一條曲線(xiàn)上運(yùn)動(dòng),它只有一個(gè)自由度。剛體在空間的運(yùn)動(dòng)既有平動(dòng)也有轉(zhuǎn)動(dòng),其自由度有六個(gè),即三個(gè)平動(dòng)自由度x、y、z和三個(gè)轉(zhuǎn)動(dòng)自由度a、b、q。如果剛體運(yùn)動(dòng)存在某些限制條件,自由度會(huì)相應(yīng)減少。 熱力學(xué)中:分子運(yùn)動(dòng)自由度就是決定一個(gè)分子在空間的位置所需要的獨(dú)立坐標(biāo)數(shù)目。 統(tǒng)計(jì)學(xué)中:在統(tǒng)計(jì)模型中,自由度指樣本中可以自由變動(dòng)的變量的個(gè)數(shù),當(dāng)有約束條件時(shí),自由度減少自由度計(jì)算公式:自由度=樣本個(gè)數(shù)-樣本數(shù)據(jù)受約束條件的個(gè)數(shù),即df = n - k(df自由度,n樣本個(gè)數(shù),k約束條件個(gè)數(shù)) 我們當(dāng)然最關(guān)心的還是統(tǒng)計(jì)學(xué)里面的自由度的概念。這里自由度的概念是怎么來(lái)的呢?據(jù)說(shuō): 一般總體方差(sigma^2),其實(shí)它是衡量所有數(shù)據(jù)對(duì)于中心位置(總體平均)平均差異的概念,所以也稱(chēng)為離散程度,通常表示為sum(Xi-Xbar)^1/2/N ,(有多少個(gè)數(shù)據(jù)就除多少)而樣本方差(S^2),則是利用樣本數(shù)據(jù)所計(jì)算出來(lái)估計(jì)總體變異用的(樣本統(tǒng)計(jì)量的基本目的:少量資料估計(jì)總體).一般習(xí)慣上,總體怎么算,樣本就怎么算,可是在統(tǒng)計(jì)上估計(jì)量(或叫樣本統(tǒng)計(jì)量)必須符合一個(gè)特性--無(wú)偏性,也就是估計(jì)量的數(shù)學(xué)期望值要等于被估計(jì)的總體參數(shù)=> E(S^2)=sigma^2(無(wú)偏估計(jì))。很不幸的,樣本變異數(shù)E(S^2)并不會(huì)等于sigma^2所以必須做修正,而修正后即為sum(Xi-Xbar)^2/(N-1).才會(huì)繼續(xù)帶出后來(lái)的自由度概念。(自由度是由修正樣本統(tǒng)計(jì)量得來(lái)的嗎?) 網(wǎng)上一些文獻(xiàn)的說(shuō)法也是林林總總。 金志成實(shí)驗(yàn)設(shè)計(jì)書(shū)中的定義:能獨(dú)立變化的數(shù)據(jù)數(shù)目。只要有n-1個(gè)數(shù)確定,第n個(gè)值就確定了,它不能自由變化。所以自由度就是n-1。自由度表示的是一組數(shù)據(jù)可以自由表化的數(shù)量的多少。 通俗點(diǎn)說(shuō),一個(gè)班上有50個(gè)人,我們知道他們語(yǔ)文成績(jī)平均分為80,現(xiàn)在只需要知道49個(gè)人的成績(jī)就能推斷出剩下那個(gè)人的成績(jī)。你可以隨便報(bào)出49個(gè)人的成績(jī),但是最后一個(gè)人的你不能瞎說(shuō),因?yàn)槠骄忠呀?jīng)固定下來(lái)了,自由度少一個(gè)了。 自由度的設(shè)定是出于這樣一個(gè)理由:在總體平均數(shù)未知時(shí),用樣本平均數(shù)去計(jì)算離差(常用小s)會(huì)受到一個(gè)限制————要計(jì)算標(biāo)準(zhǔn)差(小s)就必須先知道樣本平均數(shù),而樣本平均數(shù)和n都知道的情況下,數(shù)據(jù)的總和就是一個(gè)常數(shù)了。所以,“最后一個(gè)”樣本數(shù)據(jù)就不可以變了,因?yàn)樗亲?,總和就變了,而這是不允許的。至于有的自由度是n-2什么的,都是同樣道理。 n-1是通常的計(jì)算方法,更準(zhǔn)確的講應(yīng)該是n-k,n表示“處理”的數(shù)量,k表示實(shí)際需要計(jì)算的參數(shù)的數(shù)量。如需要計(jì)算2個(gè)參數(shù),則數(shù)據(jù)里只有n-2個(gè)數(shù)據(jù)可以自由變化。例如,一組數(shù)據(jù),平均數(shù)一定,則這組數(shù)據(jù)有n-1個(gè)數(shù)據(jù)可以自由變化;如一組數(shù)據(jù)平均數(shù)一定,標(biāo)準(zhǔn)差也一定,則有n-2個(gè)數(shù)據(jù)可以自由變化。df=n-k的得出是需要大量的數(shù)理統(tǒng)計(jì)的證明的。太復(fù)雜的情況,我們就不討論了。 對(duì)卡方分布,t分布而言,從其統(tǒng)計(jì)量的來(lái)源看,卡方分布自由度n理解為來(lái)自n個(gè)服從正態(tài)分布的樣本,而且他們之間并沒(méi)有什么約束關(guān)系,也就是說(shuō)n個(gè)樣本都是可以自由變化的。
而對(duì)于我們?cè)诮y(tǒng)計(jì)檢驗(yàn)中構(gòu)造的那些統(tǒng)計(jì)量而言,也可以這樣理解,一般自由度并不為n,是因?yàn)檫@n個(gè)樣本之間有約束關(guān)系,約束方程的個(gè)數(shù)為a,則自由度為n-a,因?yàn)橐话慵s束方程的個(gè)數(shù)等于未知參數(shù)的個(gè)數(shù),也就是說(shuō)自由度是n-未知參數(shù)的個(gè)數(shù),但是這種解釋在有些場(chǎng)合不容易理解,也沒(méi)有說(shuō)到本質(zhì)上,嚴(yán)格的解釋?xiě)?yīng)該還是從統(tǒng)計(jì)量對(duì)應(yīng)的二次型的秩的角度來(lái)理解。 參見(jiàn)南開(kāi)大學(xué)王兆軍 數(shù)理統(tǒng)計(jì)講義 2006 或幾篇論文: 1、劉麗君,數(shù)理統(tǒng)計(jì)中的“自由度”及教材中一處證明的訂正,溫州師范學(xué)院學(xué)報(bào)(自然科學(xué)版),vol24,5,2003。 2、張宏廣,自由度的求法,承德民族師專(zhuān)學(xué)報(bào),第26 卷第2 期,2006。 3、曲衛(wèi)彬,淺談“自由度”,高校教育。 |
|
|
來(lái)自: alien > 《research methods》