SPSS有話說：二元logistic回歸

洪梅6jraxg3utr 2019-08-23

展開全文

線性回歸的因變量Y必須為連續(xù)變量，但當(dāng)我們研究的因變量為分類變量時，因為不再是隨機(jī)變量，不符合正態(tài)分布，因此不能采用線性回歸，此時應(yīng)該使用Logistic回歸。

SPSS有話說

概述

Logistic回歸分析也用于研究變量之間的影響關(guān)系，即X對Y的影響情況，此處涉及的Y是分類數(shù)據(jù)。結(jié)合Y的具體情況，Logistic回歸分析可以分為三種，分別是二元Logistic回歸、多元無序Logistic回歸和多元有序Logistic回歸。Logistic回歸分析的分類情況如下圖：

如果因變量Y僅有兩個類別，分別是有無之類的分類數(shù)據(jù)，則屬于二元Logistic回歸分析。如果因變量Y有兩個以上的類別，并且類別之間沒有高低、順序關(guān)系，比如血型“A型、B型、AB型和O型”，則可以使用多元無序Logistic回歸分析。如果因變量Y的類別有兩個以上的類別，并且類別之間有高低、順序關(guān)系，如傷痛級別“輕度、中度、重度”，則可以使用多元有序Logistic回歸分析

問卷研究中，二元Logistic回歸使用頻率最高，該方法簡單易懂，多元無序Logistic回歸和多元有序Logistic回歸則相對復(fù)雜。本次僅對二元Logistic回歸進(jìn)行說明。

特別提示

在進(jìn)行二元Logistic回歸（包括其他Logistic回歸）分析前，建議先通過單因素分析（t檢驗、卡方檢驗等）考察所有自變量與因變量之間的關(guān)系，篩掉一些可能無意義的變量，再進(jìn)行多因素分析，這樣可以保證結(jié)果更加可靠。同時為了防止一些有意義的自變量被單因素分析剔除，單因素分析時將檢驗水準(zhǔn)設(shè)為P<0.01，只要小于0.01，就認(rèn)為有意義，然后進(jìn)行多因素分析。

操作步驟

問題：性別、學(xué)歷、獨(dú)生子女對去新疆就業(yè)意愿的影響？

性別：1=男，2=女；

學(xué)歷：1=研究生，2=本科生；

獨(dú)生子女：1=是，2=否；

就業(yè)意愿：1=愿意，0=不愿意。

（一）單擊“分析” “回歸” “二元logistic”

（二）選入相應(yīng)的因變量和自變量，如圖所示。

（三）單擊“分類”，將各分類變量選入“分類協(xié)變量”框中，將參考類別選中“第一個”，單擊“更改”。

注：在參考類別的右側(cè)選擇First（表示選擇變量COPD中，賦值最小的，即“0”作為參照。如果選擇Last則表示以賦值最大的作為參照）。

（四）單擊“選項”，勾選“Hosmer-Lemeshow擬合度”和“exp”（OR值），繼續(xù)。

結(jié)果解釋

①該結(jié)果顯示各變量的編碼情況。

②模型系數(shù)的Omnibus檢驗表明該模型總體有意義，R平方值越接近1，回歸模型擬合越好。

③“Hosmer-Lemeshow”檢驗，sig=0.443>0.05，即模型擬合優(yōu)度較高。

④該結(jié)果顯示，學(xué)歷（P<0.01，OR=1.684）、獨(dú)生子女（P=<0.01，OR=0.599）納入模型中有統(tǒng)計學(xué)意義，性別（P>0.05）無統(tǒng)計學(xué)意義；常量，即截距，在模型中無實際意義。根據(jù)上述的結(jié)果，研究生的就業(yè)意愿是本科生的1.684倍，非獨(dú)生子女的就業(yè)意愿是獨(dú)生子女的1.669倍(1/0.599)。