机器学习基础(六十二)—— 白化

我们可以使用 PCA 降低数据维度。在一些算法中还需要一个与之相关的预处理步骤,这个预处理过程称为白化(一些文献中也叫 sphering)。

举例来说,假设训练数据是图像,由于图像中相邻像素之间具有很强的相关性,所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性;更正式的说,我们希望通过白化过程使得学习算法的输入具有如下性质:

  • (i) 特征之间相关性较低;
  • (ii) 所有特征具有相同的方差。

你可能感兴趣的:(机器学习基础(六十二)—— 白化)