咨询随机森林模型的训练准确率、测试准确率与混淆矩阵指标解读

阿华AIGC实验室

2026-5-19

嘿，我来帮你拆解这三个指标到底能告诉你随机森林模型的哪些特性——这可是判断模型好坏的核心要点！

1. 训练准确率（Train Accuracy）

这是模型在训练数据集上预测正确的样本占总训练样本的比例，公式可以写成：(正确预测的训练样本数 / 总训练样本数) * 100%。
它主要反映模型对训练数据的拟合能力：

2. 测试准确率（Test Accuracy）

这是模型在完全未接触过的测试数据集上预测正确的比例，公式和训练准确率类似：(正确预测的测试样本数 / 总测试样本数) * 100%。
这是衡量模型泛化能力的核心指标——也就是模型能不能在真实场景的新数据上靠谱干活：

3. 混淆矩阵（Confusion Matrix）

相比准确率这种“整体概括”的指标，混淆矩阵是更细致的错误分布拆解工具——它是一个N×N的表格（N是任务的类别数），行代表样本的真实标签，列代表模型的预测标签。
拿二分类任务举例子，它会包含四个关键数值：

内容的提问来源于stack exchange，提问作者Pedro Alves

火山引擎最新活动

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

7×24在线专属智能伙伴

创作无限可能，一键生成电影级 AI 视频

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠