Dunn指数相较于其他聚类评估指标（针对K-means）的优势及优劣分析

阿华AIGC实验室

2026-5-19

关于Dunn指数的聚类评估问题解答

1. Dunn指数相较于其他聚类评估指标的优势

Dunn指数的核心计算逻辑是类间最小距离 / 类内最大直径，值越大代表聚类效果越好——类内越紧凑、类间越分离。和Calinski-Harabaz（CH）、Rand指数、Silhouette系数这些指标比，它有几个独有的优势：

直击聚类核心目标：聚类的本质就是让同一簇内样本尽可能近，不同簇尽可能远。Dunn指数直接用“最靠近的两个簇的距离”和“最松散的那个簇的内部直径”来计算，结果的物理意义非常直观，哪怕不是算法专家也能快速理解数值背后的聚类质量。
聚焦聚类的“薄弱环节”：很多指标（比如CH指数）是基于整体方差的统计平均，容易忽略局部的聚类问题——比如有两个簇几乎重叠，或者某个簇内部有严重的离散点。但Dunn指数会因为这两个问题直接降低：类间最小距离变小，或者类内最大直径变大，能精准揪出聚类结果里的短板。
无额外参数依赖：像Silhouette系数需要定义样本间距离的计算方式（虽大部分指标都需要，但Dunn的计算逻辑不需要额外调整参数），而Rand指数依赖真实标签（属于外部指标）。Dunn作为内部指标，只需要聚类后的簇结构和样本距离就能计算，不需要提前知道真实分类，也不用额外调参。

K-means是基于欧氏距离的划分式聚类，核心目标是最小化类内平方和，和Dunn指数的“类内紧凑、类间分离”目标高度契合，但结合K-means的特性，Dunn指数的表现有明显的优劣势：

精准匹配K-means的聚类目标：K-means的优化方向就是让簇内样本围绕质心紧凑分布，不同簇的质心尽可能远。Dunn指数的计算刚好能直接反映这个优化效果——如果K-means聚类效果好，类内直径会小、类间距离会大，Dunn指数自然会高，结果和K-means的迭代逻辑高度一致。
快速检测K-means的常见问题：K-means很容易因为初始质心选择不当、异常点干扰出现问题——比如某个簇被拉得很散，或者两个簇的边界模糊。Dunn指数对这些问题非常敏感：异常点会大幅增大类内直径，边界模糊会缩小类间最小距离，都会让Dunn指数显著下降，能帮你快速判断K-means的聚类结果是否可靠。

计算效率极低：K-means常用来处理大数据集，但Dunn指数需要计算所有簇对之间的最小距离，以及每个簇内所有样本对的最大距离（也就是簇的直径）。当样本量或簇数很大时，这个计算量会呈指数级增长，远不如CH指数（基于方差计算，速度快很多）高效。
对异常点过度敏感：K-means本身就容易被异常点带偏，而Dunn指数的类内最大直径会被异常点直接放大——哪怕一个簇里只有一个离群点，整个簇的直径会骤增，导致Dunn指数暴跌，无法客观反映大部分样本的聚类效果。相比之下，CH指数用方差衡量类内离散度，受单个异常点的影响反而更小。
不适合辅助选择K值：K-means最常见的需求是确定最优簇数K，但Dunn指数的变化规律很难用来找K。当K增大时，类内直径会减小，但类间最小距离也可能因为簇被拆分而变小，导致Dunn指数的波动没有明显的峰值，不像CH指数会先上升到峰值再下降，能清晰定位最优K。

内容的提问来源于stack exchange，提问作者girl101