小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

R數(shù)據(jù)分析:獨(dú)立樣本t檢驗(yàn)的統(tǒng)計(jì)效能和樣本量的計(jì)算

 CodewarCodewar 2021-02-04

今天給大家寫(xiě)寫(xiě)如何用R軟件計(jì)算t檢驗(yàn)中統(tǒng)計(jì)效能和樣本量。

實(shí)例描述

現(xiàn)在有一個(gè)公司聲稱他們的燈泡一般能用850±50個(gè)小時(shí),但是我買了一個(gè)發(fā)現(xiàn)用了700個(gè)小時(shí)就壞了,那我就懷疑了,商家虛假宣傳,那么我該如何證明呢?或者說(shuō),我要測(cè)試多少個(gè)燈泡能證明商家撒謊?

在這個(gè)例子中我們的目的就是要弄明白我們到底需要測(cè)試多少個(gè)燈泡,似乎就是一個(gè)算樣本量的問(wèn)題,在一個(gè)我們提前設(shè)定的顯著性水平和想要的統(tǒng)計(jì)效能下算出這個(gè)樣本量

這么樣思考好像挺難的,我們不妨先反過(guò)來(lái)想:

商家不是說(shuō)他的燈泡能用850±50個(gè)小時(shí)嘛,而我堅(jiān)信商家在撒謊,我認(rèn)為商家多說(shuō)了比如說(shuō)40個(gè)小時(shí),那么此時(shí)我們就有

  • H0:燈泡能用850小時(shí),

  • H1:燈泡能用810小時(shí),

這時(shí)我們會(huì)進(jìn)行一個(gè)統(tǒng)計(jì)檢驗(yàn),顯著性水平大多數(shù)情況會(huì)設(shè)定在0.05,意思是一類錯(cuò)誤的概率是0.05,就是說(shuō)當(dāng)H0為真的時(shí)候我們只有0.05的可能性拒絕它,就是說(shuō)我們這個(gè)統(tǒng)計(jì)檢驗(yàn)做出來(lái)燈泡確實(shí)用不到850小時(shí),95%的情況下我們都是可靠的,這個(gè)叫做significance level;

那么要做這個(gè)檢驗(yàn)我們還要規(guī)定一個(gè)東西叫做統(tǒng)計(jì)效能power,通常設(shè)置為0.9,就是說(shuō)我希望我做這個(gè)統(tǒng)計(jì),如果燈泡真的用不到850小時(shí),90%的情況下我能夠拒絕H0。

以上兩點(diǎn),我們首先確定檢驗(yàn)的可靠性,再次確定這個(gè)檢驗(yàn)值得做確實(shí)有效力,想的都挺美,只要我做了檢驗(yàn),如果燈泡真的用不到850小時(shí),90%的情況下我都能夠拒絕H0得到陽(yáng)性結(jié)果,而且呀,我得到陽(yáng)性結(jié)果,假陽(yáng)性的概率只有0.05。

別急,標(biāo)準(zhǔn)差在整個(gè)過(guò)程中也有重要影響,我們想象一個(gè)極端的例子,比如如果燈泡使用壽命沒(méi)有變異,就是商家說(shuō)能用850小時(shí),那么每個(gè)燈泡都應(yīng)該能用850小時(shí),此時(shí),只要一個(gè)燈泡就能解決我們的懷疑,但是現(xiàn)實(shí)總是不確定的,有的能1000小時(shí),有的能用500小時(shí),我們只能多取點(diǎn)樣本以期覆蓋更多的變異,所以變異常常也會(huì)影響我們做統(tǒng)計(jì)時(shí)的樣本量,這就扯出來(lái)了我們要討論的另一個(gè)東西,叫做效應(yīng)量下一部分會(huì)寫(xiě)它如何來(lái)的)。

實(shí)際上,,以及效應(yīng)量這四個(gè)指標(biāo),知道了任意三個(gè),就可以推導(dǎo)出最后一個(gè)。通常,是已知的(由研究者確定,一般為0.05)。

用R語(yǔ)言計(jì)算統(tǒng)計(jì)效能

在R語(yǔ)言中,對(duì)于均值檢驗(yàn)的統(tǒng)計(jì)功效和樣本量計(jì)算是非常容易的,我們只用規(guī)定另外3個(gè)值就行,比如我要計(jì)算效應(yīng)量d為(850-810)/50,統(tǒng)計(jì)功效為0.9,顯著性水平是0.05時(shí)的樣本量,寫(xiě)如下代碼就可以:

library(pwr)

pwr.t.test(d=(850-810)/50,power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")

結(jié)果就很明確了,我們只需要測(cè)試19個(gè)燈泡就可以在90%的情況下拒絕H0(如果燈泡真的用不到850小時(shí)的話)。

上面是從確定統(tǒng)計(jì)效能為0.9,顯著性水平為0.05時(shí)求樣本量。

我們還可以確定樣本量和顯著性水平后求統(tǒng)計(jì)效能:

pwr.t.test(d=(850-810)/50,n=10,sig.level=0.05,type="one.sample",alternative="two.sided")

從結(jié)果看,我們將樣本量設(shè)置為10的話,求得的統(tǒng)計(jì)效能就是0.616,也就是說(shuō),如果商家的燈泡真的用不到850小時(shí),我只用10個(gè)樣本來(lái)檢驗(yàn)的話,有差不多40%的可能性是檢驗(yàn)不出來(lái)的。

還有我們其實(shí)也可以很自然的推測(cè)出,要實(shí)現(xiàn)相同的統(tǒng)計(jì)效能,如果變異小,那么需要的樣本量也就?。憧梢韵胂髣倓偟臉O端例子),我們可以驗(yàn)證一下:

pwr.t.test(d=(850-810)/50,power=0.8,sig.level=0.05,type="one.sample",alternative="two.sided")
pwr.t.test(d=(850-810)/30,power=0.8,sig.level=0.05,type="one.sample",alternative="two.sided")

上面的代碼一個(gè)標(biāo)準(zhǔn)差是50,另一個(gè)是30,我們要實(shí)現(xiàn)0.8的統(tǒng)計(jì)效能,得到的樣本量一個(gè)是14,一個(gè)是6.5,基本上我們的推測(cè)得到了驗(yàn)證。

這兒再提一句,對(duì)于我們例子中的t檢驗(yàn),我們感興趣是兩個(gè)樣本均值之間的差異,而非單個(gè)個(gè)體之間的差異,而對(duì)于兩個(gè)樣本之間差異大小真正起作用的就是均值和標(biāo)準(zhǔn)差的比。

這個(gè)比就能夠很好地描述兩樣本之間的差異,這個(gè)就叫做效應(yīng)量:effect size

你可以看,下面的代碼因?yàn)樾?yīng)量其實(shí)是一樣的,所以最后得到的我們需要的樣本量都是18.4

pwr.t.test(d=(50-10)/50,power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")
pwr.t.test(d=(1-.2),power=0.9,sig.level=0.05,type="one.sample",alternative="two.sided")

很多時(shí)候我們這個(gè)效應(yīng)量并不是很好得到,所以經(jīng)常會(huì)有很多人問(wèn)我,顯著性水平,統(tǒng)計(jì)效能都可以默認(rèn),那么我計(jì)算樣本量時(shí)研究中的效應(yīng)量設(shè)多少啊?這個(gè)就得去查文獻(xiàn)或者做預(yù)試驗(yàn)了。

小結(jié)

今天給大家寫(xiě)了t檢驗(yàn)中樣本量和統(tǒng)計(jì)效能的計(jì)算,前面應(yīng)該還有些鋪墊的,不過(guò)我感覺(jué)別的作者已經(jīng)寫(xiě)的非常清晰了,大家可以參考AhaDad的文章:

假設(shè)檢驗(yàn)基礎(chǔ):α錯(cuò)誤,β錯(cuò)誤,樣本容量,效應(yīng)量的關(guān)系簡(jiǎn)介

感謝大家耐心看完,自己的文章都寫(xiě)的很細(xì),代碼都在原文中,希望大家都可以自己做一做,也歡迎大家的意見(jiàn)和建議。

如果你是一個(gè)大學(xué)本科生或研究生,如果你正在因?yàn)槟愕慕y(tǒng)計(jì)作業(yè)、數(shù)據(jù)分析、論文、報(bào)告、考試等發(fā)愁,如果你在使用SPSS,R,Python,Mplus, Excel中遇到任何問(wèn)題,都可以聯(lián)系我。因?yàn)槲铱梢越o您提供最好的,最詳細(xì)和耐心的數(shù)據(jù)分析服務(wù)。

如果你對(duì)Z檢驗(yàn),t檢驗(yàn),方差分析,多元方差分析,回歸,卡方檢驗(yàn),相關(guān),多水平模型,結(jié)構(gòu)方程模型,中介調(diào)節(jié)等等統(tǒng)計(jì)技巧有任何問(wèn)題,請(qǐng)私信我,獲取最詳細(xì)和耐心的指導(dǎo)。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人!

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多