对数据进行标准化,归一化。

一,归一化。
归一化是利用特征的最大最小值,将特征的值缩放到[0,1]区间,对于每一列的特征使用min-max函数进行缩放,计算公式如下
对数据进行标准化,归一化。_第1张图片

 import pandas as pd
from sklearn.preprocessing import MinMaxScaler

if __name__ == "__main__":
#读取葡萄酒数据集
data = pd.read_csv("G:/dataset/wine.csv")
#获取第二列Alcohol
x =data["Alcohol"]
#获取数据的基本情况
print(x.describe())
minMax = MinMaxScaler()
#将数据进行归一化
x_std = minMax.fit_transform(x)
print(x_std)

二,标准化。
标准化比归一化要更加实用,因为像逻辑斯蒂回归和支持向量机算法,刚开始训练的时候会将参数初始化为0或趋于0的随机极小值,如果是标准化的数据(均值为0,方差为1)对于它们而言,这更加容易利于权重的更新。将特征列标准化的计算公式如下

在这里插入图片描述

import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler

if __name__ == "__main__":
# 读取葡萄酒数据集
data = pd.read_csv("G:/dataset/wine.csv")
# 获取第二列Alcohol
x = data["Alcohol"]
std = StandardScaler()
#将x进行标准化
x_std = std.fit_transform(x)
print(x_std)

原文:https://blog.csdn.net/sinat_29957455/article/details/79490165

2,自定义实现标准化。
df_test.apply(lambda x: (x - np.min(x)) / (np.max(x) - np.min(x))) #方法一

(df_test_1 - df_test_1.min()) / (df_test_1.max() - df_test_1.min())#方法二

原文:https://blog.csdn.net/xiaosebi1111/article/details/50249187

你可能感兴趣的:(对数据进行标准化,归一化。)