如何用OpenCV从带编号网格的衣物图像中提取数字并获取坐标？

阿华AIGC实验室

2026-5-7

针对网格衣物数字识别的预处理与分离方案建议

我明白你现在的困境——噪声大的网格衣物图像里，交叉点的数字很难被轮廓检测和简单二值化搞定，还要完成定位+识别，确实挺棘手的。结合我处理类似复杂背景数字识别的经验，给你整理了一套针对性的预处理和数字分离方案，应该能帮到你：

一、针对性预处理步骤（先降噪+强化数字特征）

定向降噪，过滤网格纹理干扰
因为你的图像是衣物网格，网格是规则线条，所以可以试试形态学操作里的开运算/闭运算：先构造和网格线条粗细匹配的结构元素（比如横向矩形核处理横向网格，纵向核处理纵向），弱化或消除网格线条。另外，高斯模糊配合自适应阈值二值化（cv2.adaptiveThreshold()）比全局二值化更适合这种场景——它能让局部区域的阈值自适应调整，更好地把数字从复杂背景中分离出来。
增强数字对比度
如果数字和背景对比度低，推荐用CLAHE（限制对比度的自适应直方图均衡化），通过cv2.createCLAHE()实现，它能在不放大噪声的前提下，增强局部区域对比度，让数字边缘更清晰。也可以尝试颜色空间转换，比如把RGB转成YCrCb，提取亮度通道（Y通道）单独处理，这里数字和背景的差异通常更明显。
抵消衣物褶皱干扰
衣物褶皱会造成局部明暗不均，这时候可以用背景减法：先通过多次闭运算填充数字区域，得到纯网格背景；再用原图像减去背景，抵消褶皱带来的明暗变化，突出数字区域。

先定位网格交叉点，缩小搜索范围
既然数字在网格交叉点，先检测网格线条找到所有交叉点坐标，再以每个交叉点为中心截取固定大小的ROI（感兴趣区域），不用在整幅图里盲目找数字，能大幅减少干扰。检测网格线条可以用霍夫直线变换（cv2.HoughLinesP()）：先做Canny边缘检测提取图像边缘，再检测所有横向、纵向直线，计算它们的交点就是交叉点。
ROI内的数字分割与轮廓筛选
拿到每个交叉点的ROI后，先做二值化再用轮廓检测。这时候要设置筛选条件：
- 轮廓面积范围：排除太小的噪声点和太大的网格残留；
- 轮廓宽高比：MNIST数字的宽高比大概在0.5-1.5之间，不符合的直接过滤；
- 外接矩形位置：确保在ROI中心区域，避免边缘网格干扰。
  如果单个ROI里有多个数字（比如你提到的0412），可以用轮廓外接矩形分割，或者用垂直投影法：计算ROI每列的像素值之和，找到像素值突变的位置，就是数字间的分割线。
坐标存储小技巧
定位到每个数字的外接矩形后，把矩形的左上角/右下角/中心坐标和识别出的数字对应存储，比如用列表存储(数字, x1, y1, x2, y2)这样的元组，方便后续调用。

统一ROI尺寸
MNIST的输入是28x28灰度图，所以要把每个数字ROI先resize到28x28：建议先把ROI的最大边调整到20左右，再在周围填充灰色（和MNIST背景一致）到28x28，避免拉伸变形影响识别准确率。
适配场景的数据增强
因为你的图像噪声大，训练CNN时可以给MNIST数据集添加类似的噪声（高斯噪声、椒盐噪声）、轻微旋转和缩放，让模型更适配你的实际场景。也可以把预处理后的数字样本加入训练集做fine-tuning，进一步提升特定场景下的识别效果。

如果这些方法还是有问题，可以试试调整形态学操作的核大小、自适应阈值的参数，或者换用Sobel算子这类更鲁棒的边缘检测算法。预处理是这类任务的关键，多调参总能找到合适的组合~

内容的提问来源于stack exchange，提问作者bettsr