去量纲、数据归一化

1、去量纲

指是去除数据单位之间的不统一,将数据统一变换为无单位(统一单位)的数据集,也可以作为指标的权重,进行后续的加权计算。

2、数据归一化

数据分标准化是将数据按比例缩放,使之落入一个小的特定区间,在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

A、对一维数据的缩放有如下定义:

0-1归一化(normalization):(Xi-Xmax)/(Xmax-Xmin)

标准化(standardization):(Xi-均值)/方差

B、0-1归一化和标准化的本质:缩放和平移。线性变化得性质:线性变化不会改变原始数据的数值排序

C、0-1归一化和标准化的区别:

0-1归一化的缩放时拍扁统一到区间(仅由极值决定);标准化的缩放是更加弹性和动态的,和整体样本的分布有很大的关系。

0-1归一化:缩放仅仅跟最大和最小值得差别有关(输出范围在0-1)

标准化:缩放和每个点都有关系,通过方差体现出来。与归一化对比,标准化中所有数据点都有贡献(通过均值和标准差造成影响)。(输出范围在负无穷到正无穷)

D、0-1归一化和标准化使用情况:

如果对输出数据结果范围有要求,用归一化;

如果数据较为稳定,不存在极端的最大最小值,用归一化;

如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值得影响。

E、归一化的好处:

提升模型的收敛速度;提升模型的精度

F、常见的数据归一化方法

0-1归一化;log函数转换(通过以10为底的log函数转化的方法实现归一化);atan函数转换(反正切函数)

你可能感兴趣的:(去量纲、数据归一化)