第一集 | 2018-07-12

嗯......为什么处理数据的时候需要无量纲化,以解决各个特征的数据可比性呢?在查阅了网上的资料,得到的结论是

1. 不同的量纲导致数据有不同的量级,而数据之间不同的量级将导致使用原始的指标值进行分析的时候,会使分析更加侧重于量级大的数据,而削弱量级小的数据的作用。所以需要不同特征的数据在同一个量级,增加可比性,使分析结果更加可靠。

2.同时解决了不同特征之间由于数据不属于同一种性质,不能通过数据本身的值大小来判断具体某一数据对特征总体的作用力的大小。无量纲化,使各特征数据能在同一个数量级,使数据趋同化,从而显现出具体某一个特征中的某一个数据对特征总体的作用力大小。

3.由于各个指标的指标值的度量单位是不同的,为了能够将指标值直接参与总体的评价计算,需要无量纲化。

参考链接:

数据标准化/归一化normalization - CSDN博客

标准化和归一化什么区别? - 知乎

数据预处理之数据无量纲化(标准化/归一化) - CSDN博客

你可能感兴趣的:(第一集 | 2018-07-12)