|
線性回歸的因變量Y必須為連續(xù)變量,但當(dāng)我們研究的因變量為分類變量時,因為不再是隨機(jī)變量,不符合正態(tài)分布,因此不能采用線性回歸,此時應(yīng)該使用Logistic回歸。 SPSS有話說 概述 Logistic回歸分析也用于研究變量之間的影響關(guān)系,即X對Y的影響情況,此處涉及的Y是分類數(shù)據(jù)。結(jié)合Y的具體情況,Logistic回歸分析可以分為三種,分別是二元Logistic回歸、多元無序Logistic回歸和多元有序Logistic回歸。Logistic回歸分析的分類情況如下圖: 如果因變量Y僅有兩個類別,分別是有無之類的分類數(shù)據(jù),則屬于二元Logistic回歸分析。如果因變量Y有兩個以上的類別,并且類別之間沒有高低、順序關(guān)系,比如血型“A型、B型、AB型和O型”,則可以使用多元無序Logistic回歸分析。如果因變量Y的類別有兩個以上的類別,并且類別之間有高低、順序關(guān)系,如傷痛級別“輕度、中度、重度”,則可以使用多元有序Logistic回歸分析 問卷研究中,二元Logistic回歸使用頻率最高,該方法簡單易懂,多元無序Logistic回歸和多元有序Logistic回歸則相對復(fù)雜。本次僅對二元Logistic回歸進(jìn)行說明。 特別提示 在進(jìn)行二元Logistic回歸(包括其他Logistic回歸)分析前,建議先通過單因素分析(t檢驗、卡方檢驗等)考察所有自變量與因變量之間的關(guān)系,篩掉一些可能無意義的變量,再進(jìn)行多因素分析,這樣可以保證結(jié)果更加可靠。同時為了防止一些有意義的自變量被單因素分析剔除,單因素分析時將檢驗水準(zhǔn)設(shè)為P<0.01,只要小于0.01,就認(rèn)為有意義,然后進(jìn)行多因素分析。 操作步驟 問題:性別、學(xué)歷、獨(dú)生子女對去新疆就業(yè)意愿的影響? 性別:1=男,2=女; 學(xué)歷:1=研究生,2=本科生; 獨(dú)生子女:1=是,2=否; 就業(yè)意愿:1=愿意,0=不愿意。 (一)單擊“分析” “回歸” “二元logistic” (二)選入相應(yīng)的因變量和自變量,如圖所示。 (三)單擊“分類”,將各分類變量選入“分類協(xié)變量”框中,將參考類別選中“第一個”,單擊“更改”。 注:在參考類別的右側(cè)選擇First(表示選擇變量COPD中,賦值最小的,即“0”作為參照。如果選擇Last則表示以賦值最大的作為參照)。 (四)單擊“選項”,勾選“Hosmer-Lemeshow擬合度”和“exp”(OR值),繼續(xù)。 結(jié)果解釋 ①該結(jié)果顯示各變量的編碼情況。 ②模型系數(shù)的Omnibus檢驗表明該模型總體有意義,R平方值越接近1,回歸模型擬合越好。 ③“Hosmer-Lemeshow”檢驗,sig=0.443>0.05,即模型擬合優(yōu)度較高。 ④該結(jié)果顯示,學(xué)歷(P<0.01,OR=1.684)、獨(dú)生子女(P=<0.01,OR=0.599)納入模型中有統(tǒng)計學(xué)意義,性別(P>0.05)無統(tǒng)計學(xué)意義;常量,即截距,在模型中無實際意義。根據(jù)上述的結(jié)果,研究生的就業(yè)意愿是本科生的1.684倍,非獨(dú)生子女的就業(yè)意愿是獨(dú)生子女的1.669倍(1/0.599)。 特別提示 OR值的含義為:相對于賦值較低的研究對象,賦值較高的研究對象發(fā)生某種情況風(fēng)險的多少倍。例如,男生吸煙發(fā)生的可能性是女生的1.292倍。對于連續(xù)型變量,如:年齡,即年齡每增加1歲,患鼻咽癌的風(fēng)險增加OR倍。 |
|
|