设置相同随机种子后PyTorch训练精度为何出现差异？

阿华AIGC实验室

2026-5-14

问题解答：添加测试集评估后训练精度变化的原因

你遇到的这种训练精度的细微变化是完全预期的，并没有操作错误，主要原因可以从以下几点拆解：

1. 模型`eval()`模式下的行为差异

当你调用model.eval()切换到评估模式后，模型里的一些层会改变运行逻辑：

Dropout层：会关闭随机失活机制，所有神经元都会参与前向计算；
BatchNorm层：会使用训练阶段累积的运行时统计量（running mean/var），而非当前batch的统计值，这会让前向传播的输出结果和train()模式下产生细微差异。

你的两种实现都是在eval()模式下计算训练精度，但修改后的代码多跑了一轮测试集评估——虽然这不会改变模型参数，但结合下面的因素，就会放大精度的细微波动。

2. DataLoader的未固定随机性

你虽然设置了torch.manual_seed(1)固定主进程的随机种子，但如果你的train_loader或test_loader开启了多进程加载（num_workers > 0），每个worker进程的随机种子并没有被显式固定。PyTorch默认会给worker分配基于主种子的随机值，但这个分配逻辑在不同运行流程（比如是否加载测试集）中可能产生差异，导致训练阶段的数据加载顺序、数据增强随机操作（如果有）发生变化，最终影响梯度更新的细节，使得训练精度出现波动。

如果想要完全固定数据加载的随机性，可以给DataLoader添加worker_init_fn：

def worker_init_fn(worker_id):
    seed = torch.initial_seed() % 2**32
    torch.manual_seed(seed)

# 初始化DataLoader时传入该函数
train_loader = DataLoader(..., num_workers=4, worker_init_fn=worker_init_fn)
test_loader = DataLoader(..., num_workers=4, worker_init_fn=worker_init_fn)