|
很久之前給大家寫過一篇文章詳細介紹了樣本量計算的底層邏輯,不過那篇文章原理是依照卡方比較來寫的,可以拓展到均值比較,但視角還是比較小,今天從整個臨床研究的角度結(jié)合具體的例子談?wù)劥蠹矣龅降臉颖玖康挠嬎惴椒āS胁僮?,有原理,有比較,認真閱讀下來應(yīng)該會大有裨益。 統(tǒng)計課上都講過:我們做統(tǒng)計推斷無外乎兩個目的:一個是估計總體參數(shù)(一般是均值和率),一個是假設(shè)檢驗:
估計參數(shù)的研究中能盡可能地把總體參數(shù)估計得準,假設(shè)檢驗過程能盡可能地少犯錯誤是我們計算樣本量要達到的終極目標。 臨床研究新藥或者新的治療方式開發(fā)的臨床研究一般分為四期:
每一期都涉及統(tǒng)計操作,也都涉及樣本量的計算。統(tǒng)的看下來還是在做統(tǒng)計推斷,計算邏輯依然在假設(shè)檢驗(所以本文將估計總體參數(shù)的樣本計算略過),核心就目的一個:要正確的拒絕零假設(shè):
本身我們做假設(shè)檢驗的時候客觀的就會出現(xiàn)上表的情況,天然會犯兩類錯誤,所以我們考慮樣本量的目的就是盡可能減少犯錯誤的概率,對照上表可以從兩個方面考慮,就是減小α和β。根據(jù)假設(shè)檢驗的原理實際操作中我們通常會把α設(shè)定為0.05,所以剩下的操作空間就是β,唯一的做法就是減小β從而增大統(tǒng)計效能(1-β)。
而統(tǒng)計效能的重要影響因素之一就是樣本量。所以我們要去計算樣本量,這里一定要注意是樣本量影響了統(tǒng)計效能所以樣本量重要(根源還是統(tǒng)計效能重要)。而不是常常聽到的“樣本量的影響因素包括β”,“計算樣本量的時候要考慮統(tǒng)計效能”,這種表述統(tǒng)統(tǒng)都是錯誤的。統(tǒng)計效能我們永遠是希望越大越好。我們是為了尋求更大的統(tǒng)計效能,減小犯二類錯誤所以我們才要去要尋求一個合適的樣本量。邏輯不能搞反了。我們是Determines the minimum number of subjects for adequate study power。 當(dāng)然,樣本量是統(tǒng)計效能重要的影響因素但并非唯一的,α和效應(yīng)量等也會對統(tǒng)計效能造成影響:
比如對于一個兩樣本t檢驗,我們設(shè)定好α和β,效應(yīng)量設(shè)定為Cohen·d0.5,就可以得到樣本量為64的時候統(tǒng)計效能就可以超過0.8了。如果你覺得統(tǒng)計效能0.8夠了,那么64個樣本就夠。
上面只是一個例子,臨床研究的實驗設(shè)計種類有很多,可以歸結(jié)為下表:
對于上述研究設(shè)計,涉及到的假設(shè)檢驗如下面2張表:
總之我們要理解:我們計算樣本量的目的就是盡可能減少上面的假設(shè)檢驗的犯錯誤情況。 我們再具體看計算思路和方法。 RCT研究的樣本量計算實驗性研究中RCT是大家經(jīng)常會做的,或者是經(jīng)常需要計算樣本量的研究類型。具體到統(tǒng)計比較又有三種情況了,分別叫做優(yōu)效性實驗,等效性實驗和非劣效性實驗:
在計算之前需要明確下面幾個事情
所涉及到的公式可以參考下面文章:
我們依然是來看例子,下面例子詳細展示了一個連續(xù)變量為結(jié)局的優(yōu)效性研究的例子:
就是我們預(yù)計一種新治療能減少收縮壓10mmhg,在實驗組中130mmhg,對照組中140mmHg,優(yōu)效性界值我們?nèi)?5mmHg,α和β取0.05和0.2,那么按照上面的公式可以計算得到每組樣本是50人,共計需要樣本100人。當(dāng)然我們實際操作不會傻到對照公式一個一個去算,直接在R中使用下面代碼即可: 輸出如下,同樣是50個樣本:
結(jié)局為二分類變量的優(yōu)效性研究的例子也給大家放一個:
就是我們預(yù)計新的治療方法可以降低卒中的發(fā)病率,假設(shè)實驗組發(fā)病率為0.338,對照組率為0.564,設(shè)定優(yōu)效界值為-0.05,取α和β分別為0.05和0.2,按照上面公式可以計算得到91個樣本每組,共需要樣本182個。在R中使用下面代碼: 結(jié)果輸出如下:
比公式多了2個,考慮約分造成的誤差。 還有的時候我們單純就是要證明差異,不考慮到底是優(yōu)效性還是非劣效性的問題,這個時候可以理解為界值為0的優(yōu)效性實驗??聪旅娴睦樱?/span>
就是說我們就想比較兩組血壓是否有差異,血壓的總體標準差為20mmHg,兩組的差值為15mmHg我們認為有意義,那么按照box1中的公式我們得到28個樣本每組,共56個樣本就可以,當(dāng)然我們也可以使用下面代碼直接得到結(jié)果: 得到結(jié)果也是每組29人,共需要58人(誤差歸因于約分):
需要注意的是函數(shù)中的d為效應(yīng)量,其和絕對差異是有區(qū)別的,對于連續(xù)變量來講,其就是絕對誤差除以變異:
那么對于此例子我們也可以將其看作是界值為0的優(yōu)效性實驗,但是根據(jù)優(yōu)效和雙側(cè)假設(shè)的原理我們需要將α設(shè)定為0.025,如下代碼計算后依然可以得到結(jié)果為28:
這樣我們就將優(yōu)效性/非劣效性實驗研究的樣本量計算和尋求差異的研究樣本量計算統(tǒng)一起來了。 再看一個分類結(jié)局的例子:就是根據(jù)以往研究,治療組的的高血壓患病率是0.2,對照組是0.3,我們認為差異0.1在臨床上是有意義的,那么在α為0.05,統(tǒng)計效能為0.8的情況下根據(jù)box2的公式可以算出每組樣本應(yīng)該為291,合計需要582個樣本。
我們依然可以用兩組率的比較的代碼直接得到結(jié)果:
同樣的我們依然可以將其看作是一個界值為0的非劣效/有效性研究,對應(yīng)的樣本量計算方法依然可以得到同樣的的結(jié)果:
再一次鞏固了將優(yōu)效性/非劣效性實驗研究的樣本量計算和尋求差異的研究樣本量計算是統(tǒng)一的。能看到這,其實基本的rct研究的樣本量計算根本就難不住你了,恭喜你。 simon 兩階段在新藥的臨床開發(fā)過程中,II期臨床研究一般會初步地確定某一個藥物的臨床療效,決定該藥物是否值得進一步的投入和開發(fā),這一步是失敗風(fēng)險最大的環(huán)節(jié)。同時,由于藥物的臨床療效尚未確定,基于倫理的考慮,我們往往希望納入的受試者控制在合理的數(shù)量,從而避免患者接受無效的治療方案。 這個時候我們關(guān)注的重點是,及早地發(fā)現(xiàn)藥物是否是未達到療效,以便及早終止實驗,及時止損,Simon兩階段的研究設(shè)計就實現(xiàn)了當(dāng)藥物療效未達到預(yù)期療效時,盡快終止試驗的目的。根本思路是,將試驗分為兩個階段,在第一個階段完成時進行一次評估,如符合預(yù)期(如對治療響應(yīng)的患者達到預(yù)期人數(shù)),進行第二階段。反之,終止試驗。具體技術(shù)路線如下圖:
可以看到,Simon兩階段設(shè)計是一個單臂設(shè)計并不涉及組間比較,第一階段先來一批樣本看一下藥的響應(yīng)情況,根據(jù)響應(yīng)情況決定研究是否進入第二階段。上圖中的r1和r都是自己預(yù)先設(shè)定的標準,x1,x2是相應(yīng)階段的響應(yīng)數(shù)量,還有統(tǒng)計中小概率事件的概率。 從上面的邏輯看,為了計算Simon兩階段設(shè)計的樣本量我們需要事先設(shè)定一些值,一個是r1:第一階段的響應(yīng)標準(unacceptable response rate; baseline response rate that needs to be exceeded for treatment to be deemed promising);還有第二階段的期望響應(yīng)標準(response rate that is desirable; should be larger than pu)。Simon兩階段設(shè)計樣本量的標準有兩個一個叫做minimax design,另一個叫做optimal design,兩種標準的邏輯是不一樣的:Minimax design的目的是使使用的總樣本量最少,optimal是使得第一階段樣本量最少。
依然是看實操:下面是某篇文獻中給到的在不同參數(shù)設(shè)定下兩個標準下的樣本量:
可以看到在第一階段響應(yīng)率設(shè)定在0.05,第二階段不低于0.25響應(yīng)率的前提下,所需要的樣本量分別為Optimal:17,Minimax:16. 我們直接在R中輸入下面代碼: 輸出如下:
和文獻中一模一樣。 小結(jié)今天從臨床研究的大的層面寫了樣本量計算的問題,涉及了大家經(jīng)常會用到的研究設(shè)計的樣本量計算,也是我經(jīng)常被同學(xué)們問的,這個問題個人也認為很重要,但似乎沒幾個人能講清楚,是醫(yī)學(xué)研究生教育應(yīng)該著力補齊的短板。這篇文章既有理論,又有實操,還有例子,實屬難得。以下還有很多我寫作本文時查閱的參考文獻,供大家參考: https://www./doi/JPMER/pdf/10.5005/jp-journals-10028-1623 https://www.ncbi.nlm./pmc/articles/PMC3148614/ http:///Calculators/Compare-2-Means/2-Sample-Equality https://www./sample_size_t_z.html https://www.ncbi.nlm./pmc/articles/PMC10020745/ https://www./power/binary-noninferior/ Sample Size Estimation in Clinical Research - CHEST (chestnet.org) Sample Size Estimation in Clinical Research: From Randomized Controlled Trials to Observational Studies - PubMed () floppybunny.org/robin/web/virtualclassroom/stats/basics/articles/gpower/Gpower_tutorial_Prajapati_2010-.pdf https://eprints./97113/8/WRRO_97113.pdf https://www./calculators/power-sample-size-calculator.php 感謝大家耐心看完,自己的文章都寫的很細,重要代碼都在原文中,希望大家都可以自己做一做。如果對您有用請先記得收藏,再點贊分享。也歡迎大家的意見和建議,大家想了解什么統(tǒng)計方法都可以在文章下留言,說不定我看見了就會給你寫教程哦,有疑問歡迎私信,有合作意向請直接滴滴我。 如果你是一個大學(xué)本科生或研究生,如果你正在因為你的統(tǒng)計作業(yè)、數(shù)據(jù)分析、模型構(gòu)建,科研統(tǒng)計設(shè)計等發(fā)愁,如果你在使用SPSS, R,Mplus中遇到任何問題,都可以聯(lián)系我。因為我可以給您提供最好的,最詳細和耐心的數(shù)據(jù)分析服務(wù)。 如果你對Z檢驗,t檢驗,方差分析,多元方差分析,回歸,卡方檢驗,相關(guān),多水平模型,結(jié)構(gòu)方程模型,中介調(diào)節(jié),量表信效度等等統(tǒng)計技巧有任何問題,請私信我,獲取詳細和耐心的指導(dǎo)。 如果你或你的團隊需要專業(yè)的科研數(shù)據(jù)清洗,建模服務(wù),教學(xué)培訓(xùn)需求等等。請聯(lián)系我。 If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #Reports, #Composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis. Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...?? Then Contact Me. I will solve your Problem... If You or Your Research Team Need Professional Scientific Data Cleaning, Model Building Services or Statistical Consulting... Please Contact Me. 往期精彩R數(shù)據(jù)分析:網(wǎng)狀meta分析的理解與實操 R數(shù)據(jù)分析:非劣效性研究設(shè)計的統(tǒng)計處理方法,原理和實例 R數(shù)據(jù)分析:集成學(xué)習(xí)方法之隨機生存森林的原理和做法,實例解析 R數(shù)據(jù)分析:凈重新分類(NRI)和綜合判別改善(IDI)指數(shù)的理解 R數(shù)據(jù)分析:反事實框架和因果中介的理論理解 R數(shù)據(jù)分析:解決科研中的“可重復(fù)危機”,理解Rmarkdown R數(shù)據(jù)分析:多項式回歸與響應(yīng)面分析的理解與實操 R數(shù)據(jù)分析:生存數(shù)據(jù)的預(yù)測模型建立方法與評價(二) R數(shù)據(jù)分析:生存數(shù)據(jù)的預(yù)測模型建立方法與評價 R數(shù)據(jù)分析:生存分析的列線圖的理解與繪制詳細教程 R數(shù)據(jù)分析:結(jié)合APA格式作圖大法講講ggplot2和ggsci,請收藏 R數(shù)據(jù)分析:變量間的非線性關(guān)系,多項式,樣條回歸和可加模型 Mplus數(shù)據(jù)分析:性別差異gendergap的相關(guān)研究如何做? R機器學(xué)習(xí):分類算法之logistics回歸分類器的原理和實現(xiàn) R數(shù)據(jù)分析:PLS結(jié)構(gòu)方程模型介紹,論文報告方法和實際操作 R數(shù)據(jù)分析:跟隨top期刊手把手教你做一個臨床預(yù)測模型 R數(shù)據(jù)分析:如何用層次聚類分析做“癥狀群”,實例操練 R數(shù)據(jù)分析:工具變量回歸與孟德爾隨機化,實例解析 R數(shù)據(jù)分析:潛類別軌跡模型LCTM的做法,實例解析 R文本挖掘:中文詞云生成,以2021新年賀詞為例 R機器學(xué)習(xí):分類算法之判別分析LDA,QDA的原理與實現(xiàn) R機器學(xué)習(xí):重復(fù)抽樣在機器學(xué)習(xí)模型建立過程中的地位理解 R數(shù)據(jù)分析:用lme4包擬合線性和非線性混合效應(yīng)模型 R數(shù)據(jù)分析:孟德爾隨機化中介的原理和實操 R數(shù)據(jù)分析:生存分析的列線圖的理解與繪制詳細教程 R數(shù)據(jù)分析:cox模型如何做預(yù)測,高分文章復(fù)現(xiàn) R數(shù)據(jù)分析:廣義估計方程式GEE的做法和解釋 R數(shù)據(jù)分析:潛類別軌跡模型LCTM的做法,實例解析 R數(shù)據(jù)分析:潛變量與降維方法(主成分分析與因子分析) R數(shù)據(jù)分析:如何給結(jié)構(gòu)方程畫路徑圖,tidySEM包詳解 R數(shù)據(jù)分析:生存分析與有競爭事件的生存分析的做法和解釋 R機器學(xué)習(xí):樸素貝葉斯與支持向量機的原理與實現(xiàn) R數(shù)據(jù)分析:混合效應(yīng)模型的可視化解釋,再不懂就真沒辦法 R數(shù)據(jù)分析:tableone包的詳細使用介紹 R數(shù)據(jù)分析:如何用lavaan包做結(jié)構(gòu)方程模型,實例解析 R機器學(xué)習(xí):分類算法之K最鄰進算法(KNN)的原理與實現(xiàn) R數(shù)據(jù)分析:潛增長模型LGM的做法和解釋,及其與混合模型對比 R數(shù)據(jù)分析:論文中的軌跡的做法,潛增長模型和增長混合模型 R數(shù)據(jù)分析:縱向分類結(jié)局的分析-馬爾可夫多態(tài)模型的理解與實操 |
|
|
來自: CodewarCodewar > 《待分類》