白化/去相关变换的作用原理：为何该预处理方法有效？

阿华AIGC实验室

2026-5-19

为什么白化变换能提升机器学习算法的效果？

这确实是个戳中痛点的好问题——刚接触白化的同学几乎都会有这个疑惑：既然原始特征的相关性本身就是一种信息，为啥要把它去掉，转成圆形簇的不相关分量呢？咱们来拆解这个问题：

首先：白化并没有丢失信息，只是重构了信息的表示

白化是线性可逆变换（比如PCA白化、ZCA白化都满足可逆性），原始特征空间里的所有信息都被完整保留了，只是把原本“纠缠在一起”的相关性结构，拆解成了独立的、无冗余的分量。举个例子：如果你的原始特征是「身高」和「体重」，这两个特征高度相关——本质是它们共享了“体型大小”这个核心信息。白化后会把这个共享信息提取成一个独立分量，剩下的则是身高和体重各自独有的差异（比如相同体型下的胖瘦、高矮）。说白了，白化是去冗余，不是丢信息。

其次：去冗余对很多机器学习算法至关重要

很多算法的性能会被特征的相关性和尺度问题拖后腿，白化正好能解决这些问题：

加速收敛，稳定训练：比如梯度下降类算法（包括神经网络），如果特征高度相关，权重更新会在冗余的方向上来回震荡，收敛变慢；白化后每个分量独立，梯度更新的方向更清晰，训练效率和稳定性都会提升。
贴合算法假设：不少经典算法（比如线性回归、高斯朴素贝叶斯、SVM）都隐含了“特征独立”的假设，白化后的数据更符合这些前提，算法的预测能力自然会更准确。
缓解内部协变量偏移：对于深度神经网络来说，白化能让每层输入的分布更稳定，避免随着训练过程输入分布不断漂移，这也是早期CNN模型普遍使用白化预处理的原因之一。