【机器学习实战】使用sklearn中的MinMaxScaler对数据进行归一化处理

1.概述

当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,而这个过程,就叫做数据归一化(Normalization),又称Min-Max Scaling。

  • 归一化后的数据服从正态分布。
  • 公式:
    在这里插入图片描述

2.代码实现

2.1 代码
from sklearn.preprocessing import MinMaxScaler
import pandas as pd
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
# pd.DataFrame(data)
# 实现归一化
scaler = MinMaxScaler() # 实例化
scaler.fit(data) # 在这里本质是生成min(x)和max(x)
result = scaler.transform(data) # 通过接口导出结果
# 使用MinMaxScaler的参数feature_range实现将数据归一化到[0,1]以外的范围中
scaler1 = MinMaxScaler(feature_range=[5,10])
result1 = scaler1.fit_transform(data)
result1
2.2 结果
  • 归一化之前的数据:
    【机器学习实战】使用sklearn中的MinMaxScaler对数据进行归一化处理_第1张图片

  • 归一化后(默认缩放范围为[0,1]):
    【机器学习实战】使用sklearn中的MinMaxScaler对数据进行归一化处理_第2张图片

  • 归一化到指定范围:

【机器学习实战】使用sklearn中的MinMaxScaler对数据进行归一化处理_第3张图片

【PS】这是我看看sklearn菜菜的视频学习笔记~

你可能感兴趣的:(sklearn,机器学习,python,归一化,数据预处理)