You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

非正态独立样本Wilcoxon-Mann-Whitney检验的效应量选择:Cohen's d与wilcoxonR适用性咨询

非正态独立样本的效应量选择建议

针对你用Wilcoxon检验分析非正态独立样本后,关于效应量选择的疑问,我整理了以下实用建议:

  • 不推荐使用Cohen's d的原因
    Cohen's d是基于均值差和合并标准差计算的效应量,它的核心假设是数据服从正态分布,而且对异常值特别敏感。你的数据是非正态的,这时候均值和标准差已经不能很好地代表数据的中心趋势和离散程度了,算出的Cohen's d没办法准确反映两组真实的差异大小,解释起来也缺乏统计学依据,所以不建议用它来汇报你的结果。

  • 优先选择Wilcoxon r(rcompanion::wilcoxonR的结果)
    这个效应量是专门为Wilcoxon-Mann-Whitney U检验设计的,它通过U统计量和样本量计算而来,反映的是两组数据的重叠程度——简单说就是“从对照组随机抽一个样本,其值大于治疗组随机样本的概率”相关的量化指标。它的取值范围是-1到1,绝对值越大说明两组差异越显著,而且完全不依赖正态分布假设,非常适配你的分析场景。更重要的是它支持计算置信区间,能让你的结果更具说服力,所以这个方法是最优选择。

  • 备选方案:Cliff's Delta
    如果你的数据存在大量极端值,或者是有序分类数据,Cliff's Delta会是更好的选择。它衡量的是“一组样本值大于另一组的概率”减去“小于另一组的概率”,取值同样在-1到1之间,对非正态数据的鲁棒性极强。你可以用rcompanion::cliffDelta()函数来计算,它也能输出置信区间,适合极端情况的效应量化。

总结一下:优先使用rcompanion::wilcoxonR得到的Wilcoxon r作为效应量,避免用Cohen's d;如果数据有极端值,考虑换成Cliff's Delta。

内容的提问来源于stack exchange,提问作者Elias

火山引擎 最新活动