基于CNN的图像超分辨率实现遇阻求助（附代码）

阿华AIGC实验室

2026-5-15

针对图像超分辨率+上色任务的问题分析与改进建议

首先，我能理解作为新手在结合CNN做图像超分辨率和上色时遇到的困扰——你的代码尝试同时完成低分辨率灰度图→高分辨率彩色图的任务，这其实是两个任务的结合（超分辨率+图像上色），难度比单一任务高很多，效果差的原因可能涉及网络结构、数据量、任务设计多个方面，下面逐一分析并给出改进方案：

核心问题分析

1. 网络结构设计不合理，特征丢失严重

你的网络先对输入的32x32灰度图做3倍上采样到96x96，随后又多次用strides=2的卷积做下采样，再反复上采样恢复尺寸。这种"放大→缩小→再放大"的操作会严重丢失图像细节，完全违背了超分辨率任务"保留并增强细节"的目标。超分辨率的核心是从低分辨率特征中重建高分辨率细节，而不是反复缩放折腾特征。

2. 训练数据量严重不足

你只用单张图片训练了2500个epoch，这会导致模型严重过拟合——它不会学习到通用的超分辨率/上色规律，只会记住这张图的噪声和局部细节，换任何其他图都失效，甚至对这张图的输出也会出现伪影。

3. 任务定位模糊：同时做超分辨率+上色，难度翻倍

你的输入是低分辨率的Lab-L通道（32x32灰度），标签是高分辨率的Lab-ab通道（96x96色彩），相当于让模型同时完成"从低分辨率重建高分辨率细节"和"给灰度图上色"两个任务，新手阶段很难同时调试好两个任务的细节，容易顾此失彼。

4. 后处理逻辑有冗余

你保存灰度版本时用了rgb2gray(lab2rgb(cur))，但cur[:,:,0]本身就是原始高分辨率的L通道（灰度），直接保存这个通道会更准确，不需要转RGB再转灰度，多余的转换可能引入色彩误差。

具体改进方案

第一步：拆分任务，先专注单一任务调试

建议先分开实现超分辨率和上色，验证每个任务的效果后再合并：

先做超分辨率：输入低分辨率灰度图（32x32 L通道），输出高分辨率灰度图（96x96 L通道），任务更简单，容易看到分辨率提升效果。
再做上色：输入高分辨率灰度图（96x96 L通道），输出高分辨率彩色图（96x96 Lab-ab通道）。
合并时：低分辨率L → 超分辨率得到高分辨率L → 上色得到最终彩色图。

第二步：重构超分辨率网络结构

参考经典的超分辨率模型（如SRCNN）设计，去掉多余的下采样，专注于从低分辨率特征重建高分辨率细节：

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import InputLayer, Conv2D, UpSampling2D

# 超分辨率模型：输入32x32灰度，输出96x96灰度
model = Sequential()
model.add(InputLayer(input_shape=(32, 32, 1)))
# 特征提取层：用小卷积核提取细节特征
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
model.add(Conv2D(64, (3, 3), activation='relu', padding='same'))
# 3倍上采样：直接放大到目标尺寸，再用卷积细化
model.add(UpSampling2D((3, 3)))
model.add(Conv2D(32, (3, 3), activation='relu', padding='same'))
# 输出层：线性激活保持灰度值范围
model.add(Conv2D(1, (3, 3), activation='linear', padding='same'))

model.compile(optimizer='adam', loss='mse')

第三步：构建合理的训练数据集

收集至少几百张图像（比如DIV2K数据集的低分辨率/高分辨率对）。
对每张高分辨率图（96x96），生成对应的低分辨率版本（用OpenCV的resize函数缩小到32x32，注意用插值方法如cv2.INTER_AREA）。
训练时用低分辨率图作为输入X，高分辨率图作为标签Y，批量输入模型训练（batch_size设为8/16，epochs设为50-100，加入EarlyStopping监控验证损失防止过拟合）。

第四步：修正色彩空间与后处理逻辑

如果要回到联合任务，确保输入输出的维度匹配，并且优化后处理：

# 保存灰度版本时直接用生成的高分辨率L通道（假设超分辨率模型输出的是高分辨率L）
output_L = model.predict(X) # shape (1,96,96,1)
imsave("img_gray_version.png", output_L[0][:,:,0])

# 如果是联合上色+超分辨率，确保标签是完整的Lab图
# 比如：X是32x32 L，Y是96x96完整Lab（L+ab），最后输出拼接完整Lab再转RGB