两独立样本比例检验的样本量n求解(α=0.05,功效=0.80)
嘿,这个问题我太熟悉了!咱们一步步拆解怎么计算你需要的样本量$n$:
两独立二项样本的样本量计算指南
你的实验本质是检验两个独立二项分布的比例是否相等——也就是对比干预前后两组人群的同意比例$p_1=R_1/n$和$p_2=R_2/n$,原假设$H_0: p_1 = p_2$,双侧备择假设$H_1: p_1 \neq p_2$,给定显著性水平$\alpha=0.05$、检验功效$1-\beta=0.80$。要算出准确的$n$,得先明确几个关键参数,再套公式计算:
1. 你得先确定的核心数值
首先得从预实验(你提到的$n=200$那组)里拿到两个关键比例:
- 干预前的同意比例$p_1 = R_1/200$
- 要么是预实验里干预后的同意比例$p_2$,要么是你认为有实际意义的最小比例差值$\delta=|p_1-p_2|$(比如你觉得至少差0.1才算干预有效)
如果预实验只做了干预前的数据,那你得先明确预期的干预后比例变化幅度,否则没法精准计算。
2. 通用计算公式(双侧检验)
针对你的需求,样本量$n$的近似计算公式是:
n = [Z_{1-α/2}×√(2×p_avg×(1-p_avg)) + Z_{1-β}×√(p1×(1-p1)+p2×(1-p2))]^2 / (p1-p2)^2
其中几个固定值:
- $Z_{1-α/2}$是标准正态分布的上$\alpha/2$分位数,$\alpha=0.05$时,这个值是1.96
- $Z_{1-β}$是标准正态分布的上$\beta$分位数,$\beta=0.20$(对应功效0.8)时,这个值是0.842
- $p_avg=(p1+p2)/2$,是两组比例的平均值
3. 举个实际例子(用预实验数据代入)
假设你的预实验中,干预前200人里有80人同意,即$p1=80/200=0.4$;你预期干预后同意比例提升到0.5(差值$\delta=0.1$):
- 先算平均比例:$p_avg=(0.4+0.5)/2=0.45$
- 代入公式计算:
- 第一部分:$1.96×√(2×0.45×0.55)≈1.96×0.7036≈1.379$
- 第二部分:$0.842×√(0.4×0.6 + 0.5×0.5)≈0.842×0.7≈0.589$
- 分子总和:$1.379+0.589≈1.968$
- 平方后除以$(0.1)^2$:$1.968²/0.01≈387$
- 最终每个组需要约390个样本(通常向上取整,避免样本量不足)
4. 额外注意事项
- 如果是单侧检验(比如你只关心干预后比例上升,不考虑下降的情况),把公式里的$Z_{1-α/2}$换成$Z_{1-α}=1.645$,计算出来的样本量会小一些
- 实际做实验时,建议多预留10%左右的样本量,用来应对失访、数据异常等突发情况
- 如果你的预实验还没拿到$p2$,先明确你想检测的最小差值$\delta$,再结合$p1$计算就行
内容的提问来源于stack exchange,提问作者fox




