如何解读YOLO或R-CNN中的Anchor Boxes（锚框）？

阿华AIGC实验室

2026-5-20

理解YOLO中Anchor Boxes的数值含义

我来帮你拆解YOLO里这些锚框数值的意义，其实没那么复杂～

在YOLO、R-CNN这类目标检测算法中，锚框（Anchor Boxes）是预先定义的一组具有不同宽高比例的框，核心作用是匹配数据集中目标物体的常见尺寸，帮模型更快学会预测目标的位置和大小。

你提到的COCO数据集对应的锚框参数，是相对于输入图像尺寸归一化后的宽高值（YOLO默认输入是416×416像素），每两个数值组成一对，代表一个锚框的宽和高：

拿你疑惑的(0.57273, 0.677385)来说：
- 第一个数0.57273是锚框的归一化宽度，第二个数0.677385是归一化高度
- 换算成实际像素的话，宽度≈0.57273×416≈238像素，高度≈0.677385×416≈282像素
- 这个锚框对应COCO数据集中小型、接近正方形的目标（比如杯子、鼠标这类小物件），因为它的宽高比例接近1:1，尺寸偏小。

剩下的四组数值对也各有分工：