|
對于每一個醫(yī)學狗來說,科研數(shù)據(jù)的統(tǒng)計分析是無法逾越的高墻,從課題設計,論文發(fā)表,畢業(yè)答辯,執(zhí)醫(yī)考試到基金課題申請,SCI撰寫發(fā)表……任何一步都離不開數(shù)據(jù)的統(tǒng)計分析。 在統(tǒng)計學的江湖,SAS,SPSS,STATA,Minitab,Eviews, R Programming Language……高手林立,不分伯仲,在眾多軟件中由于SPSS簡單的操作界面,菜單式的操作方法,成為初學者不二的選擇。 SPSS(Statistical Product and Service Solutions)是一個組合式軟件包,它集數(shù)據(jù)錄入、整理、分析功能于一身。2010年被IBM并購SPSS統(tǒng)一更名為IBM SPSS,每年8月更新版本,最新版本是2018年8月更新的SPSS 26.0。 小編作為醫(yī)學統(tǒng)計的學生,經(jīng)常會被問到,“我這樣分析行嗎?你幫我看看這個數(shù)據(jù)怎么分析?”“你幫我算個t值吧?你幫我算個卡方值吧?”等等,你有這樣的困擾嗎?今天就讓小編幫你解決這些問題,統(tǒng)計方法再也不愁了。本文以SPSS 20.0為例進行講解 分析方法的選擇 分析方法的選擇,大概是大家最頭疼的問題了。操作不會還可以找度娘,方法不會,估計度娘也拯救不了啦,那就讓小編來拯救你吧。(只說關(guān)鍵點,抓住本質(zhì)才是最重要的)筆者認為,方法選擇的思考路徑:研究目的—可分析的變量—數(shù)據(jù)類型—分析方法。研究目的很好理解但也很重要,一個數(shù)據(jù)可能發(fā)出幾篇文章,那自然研究目的就有所不同了,相對應的統(tǒng)計方法自然也就不同了,再比如,欲比較均數(shù)之間的差異,你選擇t檢驗或方差分析,若比較不同組之間率或構(gòu)成比的差異,你可以選擇卡方檢驗。 可分析的變量就是說,你在分析之前呢,先看看自己的數(shù)據(jù),比如某個變量的缺失值達到50%,那這個變量就可以直接pass過去了,再比如編號ID之類的雖然需要,但也不是我們關(guān)心的變量。下面重點就來了,數(shù)據(jù)類型是初學者最容易忽視和搞不清楚的問題,但是這對于統(tǒng)計方法的選擇至關(guān)重要,因為每個統(tǒng)計方法基本上都有相應的適用條件,說到這里不得不提一下變量類型。 基本變量類型如下: 計量資料(可以測量的、有單位的,g.身高、體重、年齡等) 計數(shù)資料:二分類、多分類(可以數(shù)個數(shù)的,g.性別:可以數(shù)出男多少人、女多少人等) 等級資料(程度呈遞進的,g.一些實驗室檢驗結(jié)果:可分為-、 、 、 ) 小編親自總結(jié)了常用統(tǒng)計方法對變量的要求,如下表: SPSS軟件的數(shù)據(jù)管理 數(shù)據(jù)管理是統(tǒng)計分析前必不可少的步驟,主要包括數(shù)據(jù)文件的建立、存取、核對和數(shù)據(jù)整理?,F(xiàn)在就先讓大家看看SPSS的界面。(常用的都圈起來了喲) 我們常遇到數(shù)據(jù)大多為Excel文件,只需要依次點擊:文件—打開—數(shù)據(jù)—選擇Excel文件—打開,就OK了。(選擇Excel文件時注意選擇文件類型,如下圖,當然如果你打開的是其他的文件類型,選擇相應的文件類型就行了。 下面我們簡單介紹一下自己錄入數(shù)據(jù),舉個例子吧,你想看看A、B藥的治療效果,已知服用A藥患者64人愈合,21人未愈合;服用B藥患者51人愈合,33人未愈合,你想看看兩個藥的療效有無差異,你知道要用卡方檢驗,但卻不知道如何將數(shù)據(jù)錄入,下面咱就來看看吧。 這樣就可以做卡方了嗎?No,常搞數(shù)據(jù)的同學可能已經(jīng)意識到了,平時Excel導入的數(shù)據(jù)都是一行數(shù)據(jù)表示一個患者的記錄,而我們錄入的數(shù)據(jù)一行則表示一種藥某種結(jié)局的人數(shù),此時就需要對數(shù)據(jù)進行加權(quán),這就是小編要強調(diào)的,操作如下:依次點擊:數(shù)據(jù)—加權(quán)個案,出現(xiàn)如下對話框,選擇加權(quán)個案,將f變量添加進去頻率變量框中,如下圖所示,點擊:確定,就好了,就可以做卡方檢驗了。 常見統(tǒng)計分析方法實例及SPSS操作 1、T檢驗(適用條件:隨機樣本,正態(tài)分布,方差齊性) T檢驗主要包括:單樣本t檢驗、配對t檢驗、兩獨立樣本的t檢驗。今天我們就以最為常見的兩獨立樣本的t檢驗為例。簡單地說就是比較兩種不同的處理,效果的差異,比如下面的例1,比較兩種降糖藥的效果。 SPSS的操作如下: (1)原始數(shù)據(jù)形式如下圖①,x表示血糖下降量,group(1:實驗組,2:對照組)。 (2)依次點擊:分析、均值比較、獨立樣本T檢驗,出現(xiàn)如下窗口,如下圖②。 (3)將x選入檢驗變量,將group選入分組變量,點擊:定義組,組1定義為1、組2定義為2(主要取決于group變量里面的值),如下圖③。 (4)點擊:選項,如下圖④,(一般選默認即可,根據(jù)自己事情要求而定),點擊:繼續(xù)。(5)點擊:確定,結(jié)果就出來了。 結(jié)果如下: ![]() 2、方差分析(適用條件:正態(tài)性、獨立性、方差齊性) 方差分析主要包括:完全隨機設計的方差分析、隨機區(qū)組設計的方差分析。今天我們就以最為常見的完全隨機設計的方差分析為例。(方差分析與T檢驗最主要的區(qū)別就是,group大于2個組別) ![]() SPSS的操作如下: (1)部分數(shù)據(jù)如下圖①,x表示體重差值,group(1常規(guī)劑量組,2中劑量組,3高劑量組)。 (2)依次點擊:分析、均值比較、 單因素ANOVA,將x選入因變量列表框,group選入因子框,如下圖②。 (3)點擊:兩兩比較,勾選LSD,顯著性水平默認0.05,如下圖③,點擊:繼續(xù)。 (4)點擊:選項,統(tǒng)計量勾選描述性,其他都默認,如下圖④,點擊:繼續(xù)。 (5)點擊:確定,結(jié)果就出來了。 ![]() 主要結(jié)果如下: ![]() 3、卡方檢驗(適用于兩個樣本率或構(gòu)成比的檢驗) 卡方檢驗一般可分為:四格表卡方檢驗、R×C的卡方檢驗、配對設計資料的卡方檢驗 廢話不多說了,直接看例題吧。 ![]() SPSS的操作如下: (1)數(shù)據(jù)如下圖①,group(1實驗組,2對照組),result(1有效,2無效),f表示頻數(shù)。 (2)依次點擊:分析、描述統(tǒng)計、 交叉表,將group選入行框,result選入列框,如下圖② (3)點擊:統(tǒng)計量,勾選卡方,如下圖③,點擊:繼續(xù)。 (4)點擊:單元格,勾選觀察值、行,其他都默認,如下圖④,點擊:繼續(xù)。 (5)其他都默認,點擊:確定,結(jié)果就出來了。 ![]() 主要結(jié)果如下: ![]() 今天就到這里吧,關(guān)注“百味科研芝士”,下期再給大家介紹相關(guān)和回歸(多元線性回歸、Logistic回歸、cox回歸)。 參考資料: 《衛(wèi)生統(tǒng)計學》第7版,方積乾主編,人民衛(wèi)生出版社,2014年5月 《SAS統(tǒng)計軟件應用》,賀佳主編,人民衛(wèi)生出版社,2014年4月 微信公眾號關(guān)注“百味科研芝士”,一個有內(nèi)容的科研號 |
|
|
來自: 百味科研芝士 > 《R語言與統(tǒng)計》