如何基于颜色范围移除浅紫色背景以优化图像文字识别？

阿华AIGC实验室

2026-5-14

我完全懂你的困扰——单一颜色匹配根本搞不定有渐变或者色差的背景，必须用颜色范围来做掩码才行。下面直接给你改好的代码，再给几个实用的替代思路：

解决方案1：基于RGB颜色范围创建掩码

把原来的精确颜色匹配改成区间判断，这样就能覆盖所有在你指定范围内的背景色了。调整一下代码：

import numpy as np
from PIL import Image

im = Image.open('capture.png')
im = im.convert('RGBA')
data = np.array(im)
rgb = data[:,:,:3]

# 定义背景颜色的RGB范围（你可以根据实际图像微调数值）
lower_rgb = np.array([0, 0, 80])
upper_rgb = np.array([20, 20, 100])

# 创建掩码：判断每个像素是否落在指定的RGB区间内
mask = np.logical_and(
    np.all(rgb >= lower_rgb, axis=-1),
    np.all(rgb <= upper_rgb, axis=-1)
)

# 替换颜色：背景转黑色，文字转白色（如果效果不对可以反过来）
black = [0, 0, 0, 255]
white = [255, 255, 255, 255]
data[mask] = black
data[np.logical_not(mask)] = white

new_im = Image.fromarray(data)
new_im.save('new_file.png')

这段代码的核心是用np.all(rgb >= lower_rgb)和np.all(rgb <= upper_rgb)分别检查每个通道的数值是否在范围内，再用np.logical_and把三个通道的判断结果合并成最终的掩码。你可以多试几次调整lower_rgb和upper_rgb的数值，找到最贴合你背景的区间。

其他实用建议

除了RGB范围匹配，还有几个方法可能更省心：

切换到HSV颜色空间：RGB对亮度变化太敏感，HSV的色相（H）通道专门用来区分颜色，即使背景亮度不均也能精准识别。你可以试试用OpenCV来处理：

import cv2
import numpy as np

im = cv2.imread('capture.png')
hsv = cv2.cvtColor(im, cv2.COLOR_BGR2HSV)

# 定义紫色的HSV范围（自己微调，比如H在120-160，S和V根据实际情况设）
lower_hsv = np.array([120, 40, 40])
upper_hsv = np.array([160, 255, 255])

# 创建掩码并应用
mask = cv2.inRange(hsv, lower_hsv, upper_hsv)
result = cv2.bitwise_not(mask)  # 反转掩码，让文字变白背景变黑
cv2.imwrite('hsv_result.png', result)

直接灰度二值化：如果文字和背景的对比度足够高，完全不用管颜色——转灰度图后用阈值切分就行：

from PIL import Image

im = Image.open('capture.png')
gray_im = im.convert('L')  # 转灰度图
# 手动设阈值（比如150，数值越大越容易把浅色背景过滤掉）
# 或者用OTSU自动计算阈值：_, binary_im = cv2.threshold(np.array(gray_im), 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)
binary_im = gray_im.point(lambda x: 0 if x < 150 else 255, '1')
binary_im.save('binary_result.png')

这种方法最简单，只要文字和背景对比度够，效果往往比颜色匹配更好。