小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

R數(shù)據(jù)分析:臨床研究樣本量計算、結(jié)果解讀與實操

 CodewarCodewar 2024-06-13 發(fā)布于山東

很久之前給大家寫過一篇文章詳細介紹了樣本量計算的底層邏輯,不過那篇文章原理是依照卡方比較來寫的,可以拓展到均值比較,但視角還是比較小,今天從整個臨床研究的角度結(jié)合具體的例子談?wù)劥蠹矣龅降臉颖玖康挠嬎惴椒āS胁僮?,有原理,有比較,認真閱讀下來應(yīng)該會大有裨益。

統(tǒng)計課上都講過:我們做統(tǒng)計推斷無外乎兩個目的:一個是估計總體參數(shù)(一般是均值和率),一個是假設(shè)檢驗:

Inferential statistics has two parts: estimation of population parameter and testing of hypothesis. According to the type of medical research, any one of them can be adopted. The estimation method is used in prevalence/descriptive studies and the testing of hypothesis is used for cohort/case control/clinical trials.

估計參數(shù)的研究中能盡可能地把總體參數(shù)估計得準,假設(shè)檢驗過程能盡可能地少犯錯誤是我們計算樣本量要達到的終極目標。

臨床研究

新藥或者新的治療方式開發(fā)的臨床研究一般分為四期:

每一期都涉及統(tǒng)計操作,也都涉及樣本量的計算。統(tǒng)的看下來還是在做統(tǒng)計推斷,計算邏輯依然在假設(shè)檢驗(所以本文將估計總體參數(shù)的樣本計算略過),核心就目的一個:要正確的拒絕零假設(shè):

本身我們做假設(shè)檢驗的時候客觀的就會出現(xiàn)上表的情況,天然會犯兩類錯誤,所以我們考慮樣本量的目的就是盡可能減少犯錯誤的概率,對照上表可以從兩個方面考慮,就是減小α和β。根據(jù)假設(shè)檢驗的原理實際操作中我們通常會把α設(shè)定為0.05,所以剩下的操作空間就是β,唯一的做法就是減小β從而增大統(tǒng)計效能(1-β)。

One of the most popular approaches to sample size determination involves studying the power of a test of hypothesis

而統(tǒng)計效能的重要影響因素之一就是樣本量。所以我們要去計算樣本量這里一定要注意是樣本量影響了統(tǒng)計效能所以樣本量重要(根源還是統(tǒng)計效能重要)。而不是常常聽到的“樣本量的影響因素包括β”,“計算樣本量的時候要考慮統(tǒng)計效能”,這種表述統(tǒng)統(tǒng)都是錯誤的。統(tǒng)計效能我們永遠是希望越大越好。我們是為了尋求更大的統(tǒng)計效能,減小犯二類錯誤所以我們才要去要尋求一個合適的樣本量。邏輯不能搞反了。我們是Determines the minimum number of subjects for adequate study power。

當(dāng)然,樣本量是統(tǒng)計效能重要的影響因素但并非唯一的,α和效應(yīng)量等也會對統(tǒng)計效能造成影響:

With continuous outcomes, 4 main components impact power: the specified effect size, the significance level, the sample size n, and the population variance σ2. Specifically, power increases with larger effect sizes, higher values of α, larger sample sizes, and less variability within the sample

比如對于一個兩樣本t檢驗,我們設(shè)定好α和β,效應(yīng)量設(shè)定為Cohen·d0.5,就可以得到樣本量為64的時候統(tǒng)計效能就可以超過0.8了。如果你覺得統(tǒng)計效能0.8夠了,那么64個樣本就夠。

上面只是一個例子,臨床研究的實驗設(shè)計種類有很多,可以歸結(jié)為下表:

對于上述研究設(shè)計,涉及到的假設(shè)檢驗如下面2張表:

總之我們要理解:我們計算樣本量的目的就是盡可能減少上面的假設(shè)檢驗的犯錯誤情況。

我們再具體看計算思路和方法。

RCT研究的樣本量計算

實驗性研究中RCT是大家經(jīng)常會做的,或者是經(jīng)常需要計算樣本量的研究類型。具體到統(tǒng)計比較又有三種情況了,分別叫做優(yōu)效性實驗,等效性實驗和非劣效性實驗:

在計算之前需要明確下面幾個事情

所涉及到的公式可以參考下面文章:

Zhong B. How to calculate sample size in randomized controlled trial? J Thorac Dis. 2009 Dec;1(1):51-4. PMID: 22263004; PMCID: PMC3256489.

我們依然是來看例子,下面例子詳細展示了一個連續(xù)變量為結(jié)局的優(yōu)效性研究的例子:

就是我們預(yù)計一種新治療能減少收縮壓10mmhg,在實驗組中130mmhg,對照組中140mmHg,優(yōu)效性界值我們?nèi)?5mmHg,α和β取0.05和0.2,那么按照上面的公式可以計算得到每組樣本是50人,共計需要樣本100人。當(dāng)然我們實際操作不會傻到對照公式一個一個去算,直接在R中使用下面代碼即可:

TwoSampleMean.NIS(alpha=0.05, beta=0.2, sigma=10 , k=1, delta=-10, margin=-5)

輸出如下,同樣是50個樣本:

結(jié)局為二分類變量的優(yōu)效性研究的例子也給大家放一個:

就是我們預(yù)計新的治療方法可以降低卒中的發(fā)病率,假設(shè)實驗組發(fā)病率為0.338,對照組率為0.564,設(shè)定優(yōu)效界值為-0.05,取α和β分別為0.05和0.2,按照上面公式可以計算得到91個樣本每組,共需要樣本182個。在R中使用下面代碼:

TwoSampleProportion.NIS(  alpha=0.05, beta=0.2, 
p1=0.338, p2=0.564, k=1, delta=-0.226, margin=-0.05)

結(jié)果輸出如下:

比公式多了2個,考慮約分造成的誤差。

還有的時候我們單純就是要證明差異,不考慮到底是優(yōu)效性還是非劣效性的問題,這個時候可以理解為界值為0的優(yōu)效性實驗??聪旅娴睦樱?/span>

就是說我們就想比較兩組血壓是否有差異,血壓的總體標準差為20mmHg,兩組的差值為15mmHg我們認為有意義,那么按照box1中的公式我們得到28個樣本每組,共56個樣本就可以,當(dāng)然我們也可以使用下面代碼直接得到結(jié)果:

pwr::pwr.t.test(
sig.level = 0.05,
type = "two.sample",
alternative = "two.sided",
power = 0.80,
d = 15/20)

得到結(jié)果也是每組29人,共需要58人(誤差歸因于約分):

需要注意的是函數(shù)中的d為效應(yīng)量,其和絕對差異是有區(qū)別的,對于連續(xù)變量來講,其就是絕對誤差除以變異:

You need to calculate an effect size (aka Cohen’s d) in order to estimate your sample size. This effect size is equal to the difference between the means at the endpoint, divided by the pooled standard deviation.

那么對于此例子我們也可以將其看作是界值為0的優(yōu)效性實驗,但是根據(jù)優(yōu)效和雙側(cè)假設(shè)的原理我們需要將α設(shè)定為0.025,如下代碼計算后依然可以得到結(jié)果為28:

這樣我們就將優(yōu)效性/非劣效性實驗研究的樣本量計算和尋求差異的研究樣本量計算統(tǒng)一起來了。

再看一個分類結(jié)局的例子:就是根據(jù)以往研究,治療組的的高血壓患病率是0.2,對照組是0.3,我們認為差異0.1在臨床上是有意義的,那么在α為0.05,統(tǒng)計效能為0.8的情況下根據(jù)box2的公式可以算出每組樣本應(yīng)該為291,合計需要582個樣本。

我們依然可以用兩組率的比較的代碼直接得到結(jié)果:

pwr.2p.test(h = ES.h(p1 = .2, p2 =0.3),
sig.level = .05,
power = .8,
alternative = "two.sided")

同樣的我們依然可以將其看作是一個界值為0的非劣效/有效性研究,對應(yīng)的樣本量計算方法依然可以得到同樣的的結(jié)果:

再一次鞏固了將優(yōu)效性/非劣效性實驗研究的樣本量計算和尋求差異的研究樣本量計算是統(tǒng)一的。能看到這,其實基本的rct研究的樣本量計算根本就難不住你了,恭喜你。

simon 兩階段

在新藥的臨床開發(fā)過程中,II期臨床研究一般會初步地確定某一個藥物的臨床療效,決定該藥物是否值得進一步的投入和開發(fā),這一步是失敗風(fēng)險最大的環(huán)節(jié)。同時,由于藥物的臨床療效尚未確定,基于倫理的考慮,我們往往希望納入的受試者控制在合理的數(shù)量,從而避免患者接受無效的治療方案。

這個時候我們關(guān)注的重點是,及早地發(fā)現(xiàn)藥物是否是未達到療效,以便及早終止實驗,及時止損,Simon兩階段的研究設(shè)計就實現(xiàn)了當(dāng)藥物療效未達到預(yù)期療效時,盡快終止試驗的目的。根本思路是,將試驗分為兩個階段,在第一個階段完成時進行一次評估,如符合預(yù)期(如對治療響應(yīng)的患者達到預(yù)期人數(shù)),進行第二階段。反之,終止試驗。具體技術(shù)路線如下圖:

可以看到,Simon兩階段設(shè)計是一個單臂設(shè)計并不涉及組間比較,第一階段先來一批樣本看一下藥的響應(yīng)情況,根據(jù)響應(yīng)情況決定研究是否進入第二階段。上圖中的r1和r都是自己預(yù)先設(shè)定的標準,x1,x2是相應(yīng)階段的響應(yīng)數(shù)量,還有統(tǒng)計中小概率事件的概率。

從上面的邏輯看,為了計算Simon兩階段設(shè)計的樣本量我們需要事先設(shè)定一些值,一個是r1:第一階段的響應(yīng)標準(unacceptable response rate; baseline response rate that needs to be exceeded for treatment to be deemed promising);還有第二階段的期望響應(yīng)標準(response rate that is desirable; should be larger than pu)。Simon兩階段設(shè)計樣本量的標準有兩個一個叫做minimax design,另一個叫做optimal design,兩種標準的邏輯是不一樣的:Minimax design的目的是使使用的總樣本量最少,optimal是使得第一階段樣本量最少。

Minimax design mainly aims to minimize the maximum sample size. Alternatively, optimal design aims to minimize the expected sample size

依然是看實操:下面是某篇文獻中給到的在不同參數(shù)設(shè)定下兩個標準下的樣本量:

可以看到在第一階段響應(yīng)率設(shè)定在0.05,第二階段不低于0.25響應(yīng)率的前提下,所需要的樣本量分別為Optimal:17,Minimax:16.

我們直接在R中輸入下面代碼:

ph2simon(0.05, 0.2, 0.05, 0.2)

輸出如下:

和文獻中一模一樣。

小結(jié)

今天從臨床研究的大的層面寫了樣本量計算的問題,涉及了大家經(jīng)常會用到的研究設(shè)計的樣本量計算,也是我經(jīng)常被同學(xué)們問的,這個問題個人也認為很重要,但似乎沒幾個人能講清楚,是醫(yī)學(xué)研究生教育應(yīng)該著力補齊的短板。這篇文章既有理論,又有實操,還有例子,實屬難得。以下還有很多我寫作本文時查閱的參考文獻,供大家參考:

https://www./doi/JPMER/pdf/10.5005/jp-journals-10028-1623

https://www.ncbi.nlm./pmc/articles/PMC3148614/

http:///Calculators/Compare-2-Means/2-Sample-Equality

https://www./sample_size_t_z.html

https://www.ncbi.nlm./pmc/articles/PMC10020745/

https://www./power/binary-noninferior/

Sample Size Estimation in Clinical Research - CHEST (chestnet.org)

Sample Size Estimation in Clinical Research: From Randomized Controlled Trials to Observational Studies - PubMed ()

floppybunny.org/robin/web/virtualclassroom/stats/basics/articles/gpower/Gpower_tutorial_Prajapati_2010-.pdf

https://eprints./97113/8/WRRO_97113.pdf

https://www./calculators/power-sample-size-calculator.php

感謝大家耐心看完,自己的文章都寫的很細,重要代碼都在原文中,希望大家都可以自己做一做。如果對您有用請先記得收藏,再點贊分享。也歡迎大家的意見和建議,大家想了解什么統(tǒng)計方法都可以在文章下留言,說不定我看見了就會給你寫教程哦,有疑問歡迎私信,有合作意向請直接滴滴我。

如果你是一個大學(xué)本科生或研究生,如果你正在因為你的統(tǒng)計作業(yè)、數(shù)據(jù)分析、模型構(gòu)建,科研統(tǒng)計設(shè)計等發(fā)愁,如果你在使用SPSS, R,Mplus中遇到任何問題,都可以聯(lián)系我。因為我可以給您提供最好的,最詳細和耐心的數(shù)據(jù)分析服務(wù)。

如果你對Z檢驗,t檢驗,方差分析,多元方差分析,回歸,卡方檢驗,相關(guān),多水平模型,結(jié)構(gòu)方程模型,中介調(diào)節(jié),量表信效度等等統(tǒng)計技巧有任何問題,請私信我,獲取詳細和耐心的指導(dǎo)。

如果你或你的團隊需要專業(yè)的科研數(shù)據(jù)清洗,建模服務(wù),教學(xué)培訓(xùn)需求等等。請聯(lián)系我。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #Reports, #Composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

If You or Your Research Team Need Professional Scientific Data Cleaning, Model Building Services or Statistical Consulting... Please Contact Me.

往期精彩

R數(shù)據(jù)分析:網(wǎng)狀meta分析的理解與實操

R數(shù)據(jù)分析:非劣效性研究設(shè)計的統(tǒng)計處理方法,原理和實例

R數(shù)據(jù)分析:集成學(xué)習(xí)方法之隨機生存森林的原理和做法,實例解析

R數(shù)據(jù)分析:凈重新分類(NRI)和綜合判別改善(IDI)指數(shù)的理解

R數(shù)據(jù)分析:反事實框架和因果中介的理論理解

R數(shù)據(jù)分析:解決科研中的“可重復(fù)危機”,理解Rmarkdown

R數(shù)據(jù)分析:多項式回歸與響應(yīng)面分析的理解與實操

R數(shù)據(jù)分析:生存數(shù)據(jù)的預(yù)測模型建立方法與評價(二)

R數(shù)據(jù)分析:生存數(shù)據(jù)的預(yù)測模型建立方法與評價

R數(shù)據(jù)分析:生存分析的列線圖的理解與繪制詳細教程

R數(shù)據(jù)分析:結(jié)合APA格式作圖大法講講ggplot2和ggsci,請收藏

R數(shù)據(jù)分析:變量間的非線性關(guān)系,多項式,樣條回歸和可加模型

Mplus數(shù)據(jù)分析:性別差異gendergap的相關(guān)研究如何做?

R機器學(xué)習(xí):分類算法之logistics回歸分類器的原理和實現(xiàn)

R數(shù)據(jù)分析:PLS結(jié)構(gòu)方程模型介紹,論文報告方法和實際操作

R數(shù)據(jù)分析:跟隨top期刊手把手教你做一個臨床預(yù)測模型

R數(shù)據(jù)分析:如何用層次聚類分析做“癥狀群”,實例操練

R數(shù)據(jù)分析:工具變量回歸與孟德爾隨機化,實例解析

R數(shù)據(jù)分析:潛類別軌跡模型LCTM的做法,實例解析

R文本挖掘:中文詞云生成,以2021新年賀詞為例

R機器學(xué)習(xí):分類算法之判別分析LDA,QDA的原理與實現(xiàn)

R機器學(xué)習(xí):重復(fù)抽樣在機器學(xué)習(xí)模型建立過程中的地位理解

R數(shù)據(jù)分析:用lme4包擬合線性和非線性混合效應(yīng)模型

R數(shù)據(jù)分析:孟德爾隨機化中介的原理和實操

R數(shù)據(jù)分析:生存分析的列線圖的理解與繪制詳細教程

R數(shù)據(jù)分析:cox模型如何做預(yù)測,高分文章復(fù)現(xiàn)

R數(shù)據(jù)分析:廣義估計方程式GEE的做法和解釋

R數(shù)據(jù)分析:潛類別軌跡模型LCTM的做法,實例解析

R數(shù)據(jù)分析:潛變量與降維方法(主成分分析與因子分析)

R數(shù)據(jù)分析:如何給結(jié)構(gòu)方程畫路徑圖,tidySEM包詳解

R數(shù)據(jù)分析:生存分析與有競爭事件的生存分析的做法和解釋

R機器學(xué)習(xí):樸素貝葉斯與支持向量機的原理與實現(xiàn)

R數(shù)據(jù)分析:混合效應(yīng)模型的可視化解釋,再不懂就真沒辦法

R數(shù)據(jù)分析:tableone包的詳細使用介紹

R數(shù)據(jù)分析:如何用lavaan包做結(jié)構(gòu)方程模型,實例解析

R機器學(xué)習(xí):分類算法之K最鄰進算法(KNN)的原理與實現(xiàn)

R數(shù)據(jù)分析:潛增長模型LGM的做法和解釋,及其與混合模型對比

R數(shù)據(jù)分析:論文中的軌跡的做法,潛增長模型和增長混合模型

R數(shù)據(jù)分析:縱向分類結(jié)局的分析-馬爾可夫多態(tài)模型的理解與實操

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多