原文鏈接http:///?p=14850回歸分析是一種十分常見的數(shù)據(jù)分析方法,通過(guò)觀測(cè)數(shù)據(jù)確定變量間的相互關(guān)系.傳統(tǒng)回歸分析以點(diǎn)數(shù)據(jù)為研究對(duì)象,預(yù)測(cè)結(jié)果也是點(diǎn)數(shù)據(jù),而真實(shí)數(shù)據(jù)往往在一定范圍內(nèi)變動(dòng)的.基于置信度可以形成置信區(qū)間,一定程度彌補(bǔ)了預(yù)測(cè)值為單點(diǎn)的不足,但將點(diǎn)數(shù)據(jù)作為研究對(duì)象,以點(diǎn)帶表某范圍內(nèi)的所有數(shù)據(jù),往往存在信息丟失的問(wèn)題. 區(qū)間回歸分析是一種以區(qū)間數(shù)為研究對(duì)象的數(shù)據(jù)分析方法.區(qū)間數(shù)能反映出數(shù)據(jù)的變動(dòng)范圍,更符合現(xiàn)實(shí)情況.區(qū)間型符號(hào)數(shù)據(jù)是區(qū)間數(shù)的一種,通過(guò)"數(shù)據(jù)打包"形成,因此除具有區(qū)間端點(diǎn)信息外,還具有區(qū)間內(nèi)部散點(diǎn)信息. 本文將做一個(gè)簡(jiǎn)短的解釋說(shuō)明如何使用R在有區(qū)間的情況下提取上下限值。讓我們從生成數(shù)據(jù)開始, X=rnorm(n)假設(shè)現(xiàn)在我們不再觀察變量x,而只是觀察一個(gè)類(我們將創(chuàng)建八個(gè)類,每個(gè)類有八分之一的觀察值) Q=quantile(x = X,(0:8)/8)例如,對(duì)于第一個(gè)值,我們有 as.character(Xcut\[1\])要提取有關(guān)這些邊界的信息,我們可以使用下面的小代碼,該代碼返回區(qū)間的下限,上限和中值 lower = c(lower1,lower2)extrai(Xcut\[1\])可以看到,我們可以在數(shù)據(jù)庫(kù)中創(chuàng)建三個(gè)變量(具有下限,上限和中值信息) B$lower=B2\[1,\]我們可以比較4個(gè)回歸(i)我們對(duì)8個(gè)類別進(jìn)行回歸,即我們的8個(gè)因子(ii)我們對(duì)區(qū)間的下限進(jìn)行回歸,(iii)對(duì)區(qū)間的“平均值”值進(jìn)行回歸(iv)對(duì)上限 regF=lm(Y~X,data=B)我們可以將預(yù)測(cè)與我們的四個(gè)模型進(jìn)行比較 更進(jìn)一步,我們還可以比較模型的AIC, AIC(regF)如果下限和上限值的使用不是確定性的,則在此處應(yīng)注意,使用區(qū)間的平均值會(huì)比使用8個(gè)因子略好。 |
|
|
來(lái)自: 拓端數(shù)據(jù) > 《待分類》