为什么要对数据做中心化和标准化处理?

本文作为学习笔记,内容摘抄自网页+自己的感想。如有错误的地方,还望指正。


在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化(Zero-centered 或者 Mean-subtraction)处理和标准化(Standardization 或者 Normalization)处理。

1.矩阵中心化

矩阵中心化是使用数据减去数据的均值。表示n个数据样本的均值,xi表示数据样本,则数据中心化使用如下公式计算:xi'=(xi-),i=1,2,3,...,n。(假定数据样本进行了中心化,即)下面的图是数据做中心化(centering)前后的对比,可以看到其实就是一个平移的过程,平移后所有数据的中心是(0,0)。


2

你可能感兴趣的:(区块链,人工智能,数据结构与算法)