小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

廣義線性模型(GLM) | Public Library of Bioinformatics

 panhoy 2014-08-29

廣義線性模型(generalized linear model, GLM)是簡單最小二乘回歸(OLS)的擴(kuò)展,在OLS的假設(shè)中,響應(yīng)變量是連續(xù)數(shù)值數(shù)據(jù)且服從正態(tài)分布,而且響應(yīng)變量期望值與預(yù)測變量之間的關(guān)系是線性關(guān)系。而廣義線性模型則放寬其假設(shè),首先響應(yīng)變量可以是正整數(shù)或分類數(shù)據(jù),其分布為某指數(shù)分布族。其次響應(yīng)變量期望值的函數(shù)(連接函數(shù))與預(yù)測變量之間的關(guān)系為線性關(guān)系。因此在進(jìn)行GLM建模時,需要指定分布類型和連接函數(shù)。

在R中通常使用glm函數(shù)構(gòu)造廣義線性模型,其中分布參數(shù)包括了binomaial(兩項(xiàng)分布)、gaussian(正態(tài)分布)、gamma(伽馬分布)、poisson(泊松分布)等。和lm函數(shù)類似,glm的建模結(jié)果可以通過下述的泛型函數(shù)進(jìn)行二次處理,如summary()、coef()、confint()、residuals()、anova()、plot()、predict()

一、Logistic回歸

Logistic回歸中假設(shè)響應(yīng)變量服從二項(xiàng)分布,參數(shù)family設(shè)置為binomial,連接函數(shù)link設(shè)置為logit,我們以AER包中的Affairs數(shù)據(jù)集作為例子。該數(shù)據(jù)集是關(guān)于婚姻出軌,其中affairs變量表示出軌次數(shù),數(shù)據(jù)集中還包括結(jié)婚時間、教育、宗教等其它變量。由于affairs為正整數(shù),為了進(jìn)行Logistic回歸先要將其轉(zhuǎn)化為二元變量。

1data(Affairs, package='AER')
2Affairs$ynaffair[Affairs$affairs < 0] <- 1
3Affairs$ynaffair[Affairs$affairs < 0] <- 0
4Affairs$ynaffair <- factor(Affairs$ynaffair,
5levels=c(0,1),
6labels=c("No","Yes"))
7model.L <- glm(ynaffair ~ age + yearsmarried + religiousness +rating, data=Affairs, family=binomial())
8summary(model.L)

若樣本觀測值變異性過大,即出現(xiàn)了過度離散現(xiàn)象,此時仍使用二項(xiàng)分布假設(shè)就會影響系數(shù)檢測的顯著性。那么補(bǔ)救的方法是使用準(zhǔn)二項(xiàng)分布(quasibinomial)。首先要檢測樣本是否存在過度離散現(xiàn)象,方法是用殘差除以殘差自由度,若超過1則意味著過度離散。那么將family參數(shù)改為quasibinomial。

其它和Logistic回歸相關(guān)的函數(shù)還包括:robust包中的glmRob函數(shù)實(shí)施穩(wěn)健GLM;mlogit包中的mlogit函數(shù)對多分類變量進(jìn)行l(wèi)ogistic回歸;rms包中的lrm函數(shù)對順序變量進(jìn)行Logistic回歸。
二、Poisson回歸

泊松回歸假設(shè)響應(yīng)變量服從泊松分布,而連接函數(shù)為log函數(shù)。仍以前面未轉(zhuǎn)化的Affairs數(shù)據(jù)集為例。建立模型后通過coef函數(shù)來提取模型系數(shù),因?yàn)椴此苫貧w中響應(yīng)變量經(jīng)過了log函數(shù)變換,所以對系數(shù)進(jìn)行指數(shù)變換可更好的對結(jié)果進(jìn)行解釋。從中觀察到,在其它變量不變前提下,結(jié)婚時間增長1年,那么出軌次數(shù)期望值則變?yōu)橹暗?.11倍。

1model.P <- glm(affairs ~ age + yearsmarried + religiousness +rating, data=Affairs, family=poisson())
2exp(coef(model.P))
(Intercept)          age  yearsmarried religiousness        rating
15.6175253     0.9733061     1.1163656     0.6971279     0.6691823

同樣,在進(jìn)行泊松分布也要考慮過度離散現(xiàn)象。其檢測方法同樣是殘差除以其自由度。若確定過度離散存在,則要將family參數(shù)設(shè)置為準(zhǔn)泊松分布(quasipoisson)。

本文來自:http://xccds1977./2012/01/blog-post.html

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多