数据预处理的几个名词:中心化,归一化,去相关,白化

中心化
对数据中的每个独立值都减去一个值,使其数据各维度的中心都移到零点

归一化
将所有数据的范围都变为一个区间,使其数值范围都几乎相等。例如把所有数据都映射到-1~1之间。

去相关
把特征之间的相关性降低,数据的协方差矩阵变成对角阵,且中心为0

白化
对去相关后的数据将其方差映射到一个差不多大小的范围,如果本身数据分布是一个多变量的高斯分布,那么白化后的数据是一个均值为0,且协方差相等的矩阵。

数据预处理的几个名词:中心化,归一化,去相关,白化_第1张图片

你可能感兴趣的:(数据预处理的几个名词:中心化,归一化,去相关,白化)