非正态独立样本Wilcoxon-Mann-Whitney检验的效应量选择：Cohen's d与wilcoxonR适用性咨询

非正态独立样本Wilcoxon-Mann-Whitney检验的效应量选择：Cohen's d与wilcoxonR适用性咨询

阿华AIGC实验室

2026-4-27

非正态独立样本的效应量选择建议

针对你用Wilcoxon检验分析非正态独立样本后，关于效应量选择的疑问，我整理了以下实用建议：

不推荐使用Cohen's d的原因：
Cohen's d是基于均值差和合并标准差计算的效应量，它的核心假设是数据服从正态分布，而且对异常值特别敏感。你的数据是非正态的，这时候均值和标准差已经不能很好地代表数据的中心趋势和离散程度了，算出的Cohen's d没办法准确反映两组真实的差异大小，解释起来也缺乏统计学依据，所以不建议用它来汇报你的结果。
优先选择Wilcoxon r（rcompanion::wilcoxonR的结果）：
这个效应量是专门为Wilcoxon-Mann-Whitney U检验设计的，它通过U统计量和样本量计算而来，反映的是两组数据的重叠程度——简单说就是“从对照组随机抽一个样本，其值大于治疗组随机样本的概率”相关的量化指标。它的取值范围是-1到1，绝对值越大说明两组差异越显著，而且完全不依赖正态分布假设，非常适配你的分析场景。更重要的是它支持计算置信区间，能让你的结果更具说服力，所以这个方法是最优选择。
备选方案：Cliff's Delta：
如果你的数据存在大量极端值，或者是有序分类数据，Cliff's Delta会是更好的选择。它衡量的是“一组样本值大于另一组的概率”减去“小于另一组的概率”，取值同样在-1到1之间，对非正态数据的鲁棒性极强。你可以用rcompanion::cliffDelta()函数来计算，它也能输出置信区间，适合极端情况的效应量化。

总结一下：优先使用rcompanion::wilcoxonR得到的Wilcoxon r作为效应量，避免用Cohen's d；如果数据有极端值，考虑换成Cliff's Delta。

内容的提问来源于stack exchange，提问作者Elias

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠