python数据预处理

sklearn preprocessing

python数据预处理

一、标准化,均值去除和按方差比例缩放

1. scale 零均值单位方差

调用scale()函数之后,数据集对应每个特征列数值的均值为0,方差为1.

2.StandardScaler计算训练集的平均值和标准差,以便测试数据集使用相同的变换。

scale和StandardScaler可以用于回归模型中的目标值处理。


二、将数据特征缩放至某一范围(scalingfeatures to a range)

1. MinMaxScaler(最小最大值标准化)

公式:X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0)) ;

X_scaler = X_std/ (max - min) + min

2. MaxAbsScaler(绝对值最大标准化)

与上述标准化方法相似,但是它通过除以最大值将训练集缩放至[-1,1]。这意味着数据已经以0为中心或者是含有非常非常多0的稀疏数据。


你可能感兴趣的:(python数据预处理)