数据归一化与z-score标准化

现实应用中,归一化和标准化都快被叫烂了,很多时候我们都认为二者有相同的意思。粗略上是可以这样认为的,功能是一样的,目的都是消除量纲的影响,以解决指标之间的可比性问题。细细品味,背后还是有些意思的。从几种方法出发。

一.min-max标准化

min-max标准化,也称为极差法,这是对原始数据的一种线性变换,使原始数据映射到[0-1]之间。

所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的 最大值映射成1,是 最大值归一化。

二.z-score标准化

z-score标准化,也称为标准化分数,这种方法根据原始数据的均值和标准差进行标准化,经过处理后的数据符合标准正态分布,即均值为0,标准差为1(根据下面的转化函数很容易证明),转化函数为:
所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的标准差映射成1,是标准差归一化。标准差分数可以回答这样一个问题:“给定数据距离其均值多少个标准差”的问题,在均值之上的数据会得到一个正的标准化分数,反之会得到一个负的标准化分数

reference to:
http://www.09dsj.com/index.php/archives/1568
http://blog.csdn.net/dkcgx/article/details/46634471
http://www.cnblogs.com/chaosimple/archive/2013/07/31/3227271.html

你可能感兴趣的:(数学积累)