归一化和标准化

(一) 归一化:

1.1目的:

解决量纲的不统一,将数据统一在0-1之间。
解释如下:
归一化和标准化_第1张图片
左边为归一化的原因是:量纲相同,所以权重的影响相同,如:y=0.1x1+100x2,此时没有做归一化处理,x2的结果会影响其值更严重。

1.2 计算公式:

归一化和标准化_第2张图片

1.3归一化的优缺点:

优点是一定可以把数值归一到 0到 1 之间,缺点是如果有一个离群值,正如我们举的例子一样,会使得一个数值为 1,其它
数值都几乎为 0,所以受离群值的影响比较大。
api: from sklearn.preprocessing import MinMaxScaler

(二) 标准化:

2.1 目的:

为了解决数据混乱,偏差严重的问题。

2.2 公式:

归一化和标准化_第3张图片
在这里插入图片描述

2.3 api:

在这里插入图片描述

你可能感兴趣的:(机器学习)