|
我們已經(jīng)發(fā)出了李連江教授的《戲說統(tǒng)計(jì)》課程中的八篇學(xué)習(xí)筆記:相關(guān)分析、顯著性檢驗(yàn)、回歸分析、多元回歸分析、因子分析與量表構(gòu)造、卡方檢驗(yàn)、對數(shù)回歸、最大似然估計(jì)。今天,我們將發(fā)出第九篇學(xué)習(xí)筆記:結(jié)構(gòu)方程模型。希望我們的整理可以繼續(xù)供大家討論學(xué)習(xí)。 結(jié)構(gòu)方程模型 提綱 一、什么是結(jié)構(gòu)方程模型 二、結(jié)構(gòu)方程模型的三個(gè)優(yōu)點(diǎn): (一)證實(shí)性因子分析 (二)路徑分析可以包括中介變量 (三)提高擬合程度 三、舉例 一、什么是結(jié)構(gòu)方程模型 結(jié)構(gòu)方程模型最早應(yīng)用于心理學(xué)領(lǐng)域,因?yàn)樵谛睦韺W(xué)領(lǐng)域中的因變量和自變量都是由多個(gè)指標(biāo)來測量的。如果要將這幾個(gè)指標(biāo)合并在一起,就需要建立一個(gè)量表。建立量表的方式有很多,但是都會(huì)遇到一個(gè)問題:如果先把幾個(gè)指標(biāo)變成一個(gè)量表,那么在這個(gè)過程中會(huì)有信息損失,有些在原生的狀態(tài)下測得的東西變成量表之后會(huì)成為粗略的東西。在這個(gè)過程中會(huì)造成信息損失。因此發(fā)展出了結(jié)構(gòu)方程模型。如果用某幾個(gè)指標(biāo)形成量表,再用量表去做回歸分析是可以的,但是會(huì)損失很多信息。 還有一個(gè)問題是做普通的回歸分析的時(shí)候,回歸模塊有一個(gè)假定:幾個(gè)自變量之間一定是彼此相關(guān)的。理論上來講,如果就假定這兩個(gè)變量不相關(guān),是不被回歸的模塊所允許的。而我們在做因果分析的時(shí)候,往往會(huì)面臨這樣的情況:我們有充分的理由或充分的理論依據(jù)認(rèn)為這兩個(gè)自變量之間不相關(guān)。那么這個(gè)時(shí)候我們就可以規(guī)定這兩個(gè)變量是不相關(guān)的,但是在正常做回歸分析的時(shí)候,是不能夠這樣做的。另外一個(gè)情況是,有一些因果鏈條,A的變化會(huì)影響C,但是A的變化不是直接影響C的,而是通過影響B(tài)來影響C。舉個(gè)簡單的例子,祖父對于孫子是有影響的,但是祖父對于孫子的影響不是直接的影響,而是通過影響孫子的父母一方。如果我們想分析祖父影響孫子,就要看一看祖父是怎樣影響孫子的父輩,再來看怎么樣影響到孫子。在這里有一個(gè)中介變量B。這用普通的回歸分析是不能夠得出結(jié)果的,而是需要做一個(gè)路徑分析。我們需要畫一個(gè)很精確的路徑,從A到B,從B到C,這個(gè)也是結(jié)構(gòu)方程模型可以解決的問題。 二、結(jié)構(gòu)方程模型的優(yōu)勢 (一) 結(jié)構(gòu)方程模型簡單來說就是兩個(gè)分析工具的結(jié)合。我們前面講到的最主要的分析工具一是回歸分析,可以幫助我們確定有沒有獨(dú)一無二的一一對應(yīng)的相關(guān)關(guān)系;二是因子分析,可以允許我們用多個(gè)指標(biāo)去測量一個(gè)潛伏的、看不見的變量(比如說一個(gè)人對于政治局勢的態(tài)度,我們是通過看他怎么樣看中國民主問題、國防問題等來看他內(nèi)心深處對于政治的關(guān)心)。結(jié)構(gòu)方程模型就是將回歸分析和因子分析結(jié)合起來。證實(shí)性因子分析是我們先假定有一個(gè)因子,然后看從這個(gè)因子應(yīng)該會(huì)影響到幾個(gè)指標(biāo)的情況。我們先將結(jié)構(gòu)畫出來,然后看數(shù)據(jù)里面是不是這樣的情況,如果不是的話,就可以采取修正模型。證實(shí)性因子分析是一個(gè)學(xué)科到達(dá)相對成熟的狀態(tài)時(shí)所做的研究,我們根據(jù)現(xiàn)在的研究和理論推斷發(fā)現(xiàn)一個(gè)人有這樣一種態(tài)度,這種態(tài)度會(huì)折射成幾個(gè)方面的指標(biāo)。比如說我們要想檢測一個(gè)人對待同性戀的開放度,我們會(huì)設(shè)計(jì)一系列的指標(biāo),這些指標(biāo)都是根據(jù)理論推斷出來的,那么這些指標(biāo)是否都是真正反映人內(nèi)心的寬容度,我們可以通過看數(shù)據(jù)來判斷是否符合。從先有理論,再看數(shù)據(jù),這是一個(gè)證實(shí)性的過程。
(二) 另外一個(gè)優(yōu)勢是可以包括中介變量,通過觀察A影響B(tài),B影響C。(在第一部分什么是結(jié)構(gòu)方程模型里有舉例) (三) 第三個(gè)優(yōu)勢是提高擬合優(yōu)度,結(jié)構(gòu)方程模型有一個(gè)特點(diǎn)是在做完模型之后,可以看出我們這個(gè)模型和數(shù)據(jù)是不是合身的。而我們做線性回歸的時(shí)候,這一點(diǎn)是看不出來的。有人說我們是不是可以用判定系數(shù)來判斷模型是不是合身,是判斷不出來的,因?yàn)榕卸ㄏ禂?shù)只能夠告訴你這個(gè)衣服有沒有遮蔽身體,遮蔽了多少的身體??墒沁@個(gè)遮蔽身體并不意味著衣服合身。比如穿衣服最重要的功能是蔽體,另外一種功能是保暖,如果我們關(guān)心的是保暖,判定系數(shù)只能告訴你這個(gè)模型所包含的幾個(gè)變量可以告訴你保住一部分身體的溫度,可是這個(gè)部分的身體到底是哪個(gè)部分,我們是不清楚的,如果我們想要保住的是胸部的溫度,但是實(shí)際上保住的是70%腿部的溫度,那么這個(gè)衣服就是不合身的。對于衣服是否合身,結(jié)構(gòu)方程模型是有一個(gè)非常清晰的檢驗(yàn)指標(biāo)。 三、舉例 在數(shù)據(jù)中看到的指標(biāo)都是用方框來表示的,這些指標(biāo)背后看不見的因子是用橢圓形來表示的,每一個(gè)箭頭指的都是一個(gè)因果關(guān)系。例如,想要了解某人對于選舉的愛好程度,當(dāng)有了一個(gè)態(tài)度之后就會(huì)直接影響到某人怎么回答方框中的問題。所以橢圓形是一個(gè)自變量,方框是一個(gè)因變量,圓形是一個(gè)誤差量。每一條線所表示的都是一個(gè)方程式,每一個(gè)方程式都是一個(gè)等式,每一個(gè)等式都是一個(gè)回歸模型。為什么叫做結(jié)構(gòu)方程,一個(gè)方程就是一個(gè)公式Y(jié)=A+BX+E。圖中有5個(gè)回歸公式,而這些公式是有結(jié)構(gòu)的,是由同一個(gè)自變量影響到5個(gè)因變量,而在這5個(gè)因變量里面可以認(rèn)為左邊兩個(gè)和右邊兩個(gè)是分別相關(guān)的,這些都是結(jié)構(gòu)。所謂結(jié)構(gòu)方程就是有結(jié)構(gòu)的一系列方程。圖中就是一個(gè)測量模型。在做常規(guī)模型的時(shí)候會(huì)將這幾個(gè)指標(biāo)匯合起來,變成一個(gè)量表。但是如果這樣做就會(huì)損失掉一些信息。圖中的測量模型就保全了可能會(huì)損失掉的信息。 圖中的5個(gè)箭頭中,會(huì)發(fā)現(xiàn)箭頭旁有1,這個(gè)1是干什么的呢?這個(gè)1就是限定自變量與該箭頭所指向的因變量之間的回歸系數(shù)為1。我們通過學(xué)習(xí)知道,如果回歸系數(shù)是1的話,意味著自變量變化一個(gè)單位,因變量就變化一個(gè)單位。我們假定對于選舉的偏好是一個(gè)量,但是這個(gè)量的單位是不清楚的,它是一個(gè)隱含的東西。而因變量是有一個(gè)很明確的測量單位的。在此劃定1,是相當(dāng)于從因變量這里借了一把尺子,然后自變量就有了測量單位了。
測量模型是測量對于選舉的愛好程度,那么什么因素會(huì)影響到對于選舉的愛好程度呢?我們根據(jù)政治學(xué)的常識(shí)可以判斷出,如果我們現(xiàn)在的群眾很信任政府領(lǐng)導(dǎo)人,那么群眾對選舉是沒有興趣的,如果不信任的話,那么群眾有可能會(huì)要求選舉。所以信任會(huì)影響到對于選舉的愛好。另外,如果一個(gè)人不一定相信領(lǐng)導(dǎo)人,但是同時(shí)如果群眾對自己的政治能力信任度比較低,也會(huì)影響對選舉的興趣。所以政治效能感也會(huì)影響到對于選舉的偏好。但是信任和效能感這兩個(gè)因素也有可能是相關(guān)的,因此用雙向箭頭表示,就這樣形成了結(jié)構(gòu)模型。 什么是優(yōu)越性?就是做完方程模型之后,就是要看這件衣服與這個(gè)人是否合身,如果合身的話我們可以根據(jù)這件衣服來猜這個(gè)人的胳膊有多長,腰有多粗。如果這個(gè)衣服不合身,那就沒法猜準(zhǔn)。圖中所示,最小卡方值除以自由度等于18.55,這個(gè)時(shí)候我們要來看一下這是不是我們希望看到的。前面講到卡方值的時(shí)候,自由度為1時(shí),如果卡方值為4,那么相對應(yīng)的是5%的概率,所以卡方值除以自由度如果是等于4,那就相當(dāng)于說是一個(gè)自由度對4個(gè)卡方值是5%的概率。在圖中的例子里,我們所希望看到的結(jié)果是sig大于0.05。這個(gè)地方的零假設(shè)是認(rèn)為這個(gè)模型與這個(gè)數(shù)據(jù)是天衣無縫的,所以這個(gè)時(shí)候希望是接納零假設(shè)。我們在分析模型的擬合程度的時(shí)候,仍然是用卡方檢驗(yàn),但是這個(gè)時(shí)候我們所希望看到的卡方值越小越好,顯著度越大越好。如果做不到這些,會(huì)選擇一些替代的方法看這個(gè)模型是否合適。這個(gè)時(shí)候就會(huì)有一些替代指標(biāo),比如比較擬合系數(shù),正態(tài)化的擬合系數(shù)等。 |
|
|