基于Python+OpenCV的二值图像降噪及优化二值化方案咨询

阿华AIGC实验室

2026-5-20

解决二值化图像噪声问题，优化OCR预处理流程

我明白你现在的困境——自适应高斯阈值得到的二值图噪声太多，影响后续OCR，而且fastNlMeansDenoising没起明显作用。别担心，咱们可以从针对性噪声去除和优化二值化全流程两个方向来解决，下面给你具体的实操方案：

一、针对二值图的噪声去除方法

fastNlMeansDenoising更适合灰度图的高斯噪声，对二值图的斑点噪声效果有限，试试下面两种方法：

1. 形态学操作（快速去除小斑点）

二值图里的小噪声大多是孤立的白色/黑色小色块，用形态学开运算（先腐蚀再膨胀）可以有效去除白色小噪声，闭运算则适合处理黑色小空洞。

import cv2
import numpy as np

# 读取你的二值图像（0=黑色背景，255=白色前景）
binary_img = cv2.imread('your_binary_image.png', 0)

# 定义结构元素（可以根据噪声大小调整，比如3x3或5x5矩形核）
kernel = np.ones((3, 3), np.uint8)
# 开运算：去除白色小噪声
denoised_img = cv2.morphologyEx(binary_img, cv2.MORPH_OPEN, kernel, iterations=1)

# 如果还有黑色小空洞，再追加闭运算
# denoised_img = cv2.morphologyEx(denoised_img, cv2.MORPH_CLOSE, kernel, iterations=1)

cv2.imwrite('denoised_binary.png', denoised_img)

2. 连通区域过滤（精准剔除小面积噪声）

如果噪声是大小不一的斑点，可以通过连通区域分析，过滤掉面积小于阈值的区域，保留真正的文本块。

# 读取二值图
binary_img = cv2.imread('your_binary_image.png', 0)

# 获取所有连通区域的信息（包含面积、位置等）
num_labels, labels, stats, _ = cv2.connectedComponentsWithStats(binary_img, connectivity=8)

# 设置最小面积阈值（根据你的图像调整，比如过滤面积<20的区域）
min_area = 20
denoised_img = np.zeros_like(binary_img)

# 遍历所有连通区域（跳过背景标签0）
for label in range(1, num_labels):
    if stats[label, cv2.CC_STAT_AREA] >= min_area:
        # 保留符合面积要求的区域
        denoised_img[labels == label] = 255

cv2.imwrite('denoised_connected.png', denoised_img)

二、优化二值化方案（从源头减少噪声）

其实最好的降噪是在二值化前就处理掉噪声，避免二值化过程中把噪声保留下来。试试这些预处理+二值化的组合：

1. 预处理滤波+自适应阈值

先对原始灰度图做中值滤波（专门对付椒盐噪声），再用自适应高斯阈值，调整参数让结果更干净：

# 读取原始灰度图像
gray_img = cv2.imread('your_original_image.png', 0)

# 中值滤波：去除椒盐噪声，窗口大小建议选奇数（3、5等）
filtered_gray = cv2.medianBlur(gray_img, 3)

# 自适应高斯阈值：调整blockSize（奇数）和C值（偏移量）
# 用THRESH_BINARY_INV还是THRESH_BINARY取决于你的文本和背景颜色
binary_img = cv2.adaptiveThreshold(
    filtered_gray, 255, 
    cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
    cv2.THRESH_BINARY_INV, 
    blockSize=11,  # 可以尝试15、19等
    C=2  # 可以尝试1、3，值越大越容易把暗区域变成白色
)

cv2.imwrite('optimized_binary.png', binary_img)

2. Sauvola阈值（适合光照不均的场景）

Sauvola阈值比OpenCV自带的自适应阈值更适合文本图像，尤其是光照不均匀的情况，它会根据局部区域的均值和标准差动态调整阈值。需要用skimage库实现：

from skimage.filters import threshold_sauvola
import cv2
import numpy as np

gray_img = cv2.imread('your_original_image.png', 0)
filtered_gray = cv2.medianBlur(gray_img, 3)

# 设置窗口大小（奇数，建议11、21）
window_size = 11
sauvola_thresh = threshold_sauvola(filtered_gray, window_size=window_size)
# 生成二值图，这里根据你的文本颜色调整反转
binary_sauvola = (filtered_gray > sauvola_thresh) * 255
binary_sauvola = binary_sauvola.astype(np.uint8)

cv2.imwrite('sauvola_binary.png', binary_sauvola)

3. CLAHE对比度增强+二值化

如果图像整体对比度低，先做CLAHE增强局部对比度，再二值化，能让文本更清晰：

gray_img = cv2.imread('your_original_image.png', 0)

# 创建CLAHE对象，限制对比度避免过度增强噪声
clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8, 8))
enhanced_gray = clahe.apply(gray_img)

# 再做自适应阈值
binary_img = cv2.adaptiveThreshold(
    enhanced_gray, 255, 
    cv2.ADAPTIVE_THRESH_GAUSSIAN_C, 
    cv2.THRESH_BINARY_INV, 
    blockSize=11, 
    C=2
)

cv2.imwrite('clahe_binary.png', binary_img)