|
調(diào)查問(wèn)卷數(shù)據(jù)分析中經(jīng)常遇到對(duì)數(shù)據(jù)進(jìn)行加權(quán)的問(wèn)題,什么是加權(quán)?沈浩老師博客中這樣描述:讓一些人變得比另一些人更重要!那為什么要加權(quán)?為了讓調(diào)查數(shù)據(jù)在特征的分布上更接近實(shí)際情況。 比如在會(huì)員數(shù)據(jù)中,男女比例是6:4,而調(diào)查問(wèn)卷的比例是7:3,為了使調(diào)查結(jié)果更貼近真實(shí),首先需要對(duì)問(wèn)卷進(jìn)行加權(quán)處理,讓問(wèn)卷的分布結(jié)構(gòu)跟實(shí)際分布保持一致。 從概念上,加權(quán):通過(guò)對(duì)總體中的各個(gè)樣本設(shè)置不同的數(shù)值系數(shù)(即加權(quán)因子-權(quán)重),使樣本呈現(xiàn)希望的相對(duì)重要性程度。通俗一些的公式:設(shè)計(jì)加權(quán)=某個(gè)變量或指標(biāo)的期望比例/該變量或指標(biāo)的實(shí)際比例。 看一個(gè)SPSS文件加權(quán)案例: 有一家數(shù)碼產(chǎn)品專(zhuān)營(yíng)店,它有一大批忠實(shí)的會(huì)員經(jīng)常購(gòu)買(mǎi)。為了更好的經(jīng)營(yíng)好自己即將要開(kāi)設(shè)的網(wǎng)店,在會(huì)員中進(jìn)行了一次購(gòu)買(mǎi)習(xí)慣的問(wèn)卷調(diào)查。在問(wèn)卷的校驗(yàn)過(guò)程中,他們發(fā)現(xiàn)回收的問(wèn)卷在人口特征的分布上與實(shí)際情況不符,會(huì)員中男女比例是6:4,而問(wèn)卷中是7:3,并且男女會(huì)員實(shí)際在教育水平(1、2、3、4個(gè)檔)的占比均為2:2:4:2。 考慮到這兩個(gè)因素可能對(duì)分析結(jié)果有較大的影響,現(xiàn)在需要對(duì)問(wèn)卷數(shù)據(jù)進(jìn)行加權(quán)處理,使得加權(quán)后的性別和教育水平能夠符合實(shí)際比例。 1、匯總問(wèn)卷數(shù)據(jù),計(jì)算加權(quán)的權(quán)重 SPSS本身具有過(guò)硬的數(shù)據(jù)匯總功能,利用這些功能能夠快速準(zhǔn)確的對(duì)原始問(wèn)卷數(shù)據(jù)進(jìn)行大范圍的匯總,主要在于獲知不同男女性別在不同教育水平的人數(shù),和參與問(wèn)卷的總?cè)藬?shù),然后根據(jù)“權(quán)重=變量的會(huì)員比例/該變量問(wèn)卷比例”來(lái)計(jì)算最終的權(quán)重(本案例用這個(gè)公式)。 熟悉excel電子表格的話,也可以利用excel的透視表功能快速對(duì)問(wèn)卷數(shù)據(jù)進(jìn)行匯總并計(jì)算權(quán)重,這里略過(guò)。 表格的“會(huì)員比例”即男女會(huì)員在教育水平的占比2:2:4:2,男性0.6,女性0.4。最后一列即根據(jù)公式計(jì)算而得到的“權(quán)重”。 2、將權(quán)重?cái)?shù)據(jù)合并到原始問(wèn)卷數(shù)據(jù)中 這個(gè)步驟充分顯示了SPSS合并數(shù)據(jù)文件的能力,SPSS合并數(shù)據(jù)有兩種,一種是增加記錄,另外一種是增加變量,我們現(xiàn)在需要把“權(quán)重”變量合并到原始問(wèn)卷數(shù)據(jù)文件中,而且要求是和不同性別不同教育水平向匹配及對(duì)應(yīng)的操作。 說(shuō)得直白一點(diǎn),其實(shí)相當(dāng)于excel的vlookup功能,此時(shí)發(fā)現(xiàn),spss的合并數(shù)據(jù)比vlookup更條件化,簡(jiǎn)單易于操作。這兩種方法沒(méi)有必要過(guò)多對(duì)比,你熟悉哪種選擇哪種。 最后的效果是: 3、SPSS加權(quán)個(gè)案,將“權(quán)重”作為頻率變量 選擇“數(shù)據(jù)”菜單最后一項(xiàng)“加權(quán)個(gè)案”,按照彈出的菜單提出來(lái)操作,點(diǎn)擊確定后,加權(quán)處理則持續(xù)存在于接下來(lái)的各種分析操作中,如果不想使用加權(quán)處理,則必須取消加權(quán),這一點(diǎn)需格外注意。 4、加權(quán)與不加權(quán),我們來(lái)做一個(gè)比較 首先,我們看不加權(quán)時(shí)的問(wèn)卷數(shù)據(jù): 參與調(diào)查的男女比例大概是7:3,與實(shí)際會(huì)員比例6:4不符,教育程度的比例也不符合2:2:4:2。 接下來(lái)看加權(quán)處理后的效果: 此時(shí),經(jīng)過(guò)加權(quán)處理對(duì)樣本進(jìn)行校正均衡,使得調(diào)查數(shù)據(jù)在分布上完全和會(huì)員實(shí)際分布相符,達(dá)到分析的目的,基于這樣一個(gè)靠近實(shí)際情況的數(shù)據(jù)然后再進(jìn)行分析,其各項(xiàng)結(jié)論也更趨向于接近實(shí)際狀況。 記住一點(diǎn):加權(quán)也是篡改數(shù)據(jù)的方法!謹(jǐn)慎使用! 如果數(shù)據(jù)有“加權(quán)”,我們要明確地告訴客戶: 為什么加權(quán)? 加權(quán)方案的實(shí)施過(guò)程; 加權(quán)對(duì)數(shù)據(jù)的影響,等等; 通常,我們應(yīng)該:在數(shù)據(jù)報(bào)告過(guò)程中,在圖表上同時(shí)標(biāo)明“未加權(quán)”和“加權(quán)”的基數(shù);在分析報(bào)告可靈活處理,但也應(yīng)有清晰的、一致的標(biāo)注; 記住一點(diǎn):加權(quán)也是篡改數(shù)據(jù)的方法!謹(jǐn)慎使用?。ㄉ蚝评蠋煵┛驼Z(yǔ)) 參考自: 1.沈浩老師博客:調(diào)查數(shù)據(jù)的加權(quán)處理技術(shù) 2.張文彤、鐘云飛老師:《IBM SPSS 數(shù)據(jù)分析與挖掘?qū)崙?zhàn)案例精粹》第四章 本文整理編輯:數(shù)據(jù)小兵 任何人經(jīng)過(guò)一段時(shí)間的刻意學(xué)習(xí)和訓(xùn)練之后,都能使用SPSS完成統(tǒng)計(jì)分析任務(wù)和基本的數(shù)據(jù)分析工作,SPSS是最容易入門(mén)并熟練掌握的統(tǒng)計(jì)分析軟件工具,本號(hào)推出的SPSS在線視頻教程《SPSS從入門(mén)到實(shí)踐提高》長(zhǎng)期維護(hù)更新,想學(xué)習(xí)SPSS的讀者歡迎加入。 全套課程目前145個(gè)課時(shí),由數(shù)據(jù)小兵長(zhǎng)期更新維護(hù),提供配套案例、作業(yè)題批改及答案、一對(duì)一討論解決問(wèn)題。能力有限,竭誠(chéng)服務(wù),歡迎加入。 Q:課程有時(shí)間限制嗎? A:本課程一次購(gòu)買(mǎi),永久有效,可反復(fù)多次觀看,階梯定價(jià),早購(gòu)買(mǎi)更劃算。 Q:課程觀看方式? A:課程為錄播好的高清視頻,支持PC電腦、手機(jī)、ipad流暢播放,支持倍速播放。 Q:有疑問(wèn)怎么解決? A:本課程最大亮點(diǎn),由課程開(kāi)發(fā)者(講師數(shù)據(jù)小兵)親自一對(duì)一答疑解惑,多溝通交流有助于快速提升。 |
|
|
來(lái)自: 洪梅6jraxg3utr > 《統(tǒng)計(jì)》