机器学习 | 简单但是能提升模型效果的特征标准化方法(RobustScaler、MinMaxScaler、StandardScaler 比较和解析)

文章目录

  • 一、方法解析
  • 二、Python 实践


一、方法解析

机器学习 | 简单但是能提升模型效果的特征标准化方法(RobustScaler、MinMaxScaler、StandardScaler 比较和解析)_第1张图片

我们在做数据预处理时通常会使用 sklearn 的 StandardScaler 来做特征的标准化,但如果你的数据中包含异常值,那么效果可能不好。

本文重点介绍的方法叫 RobustScaler,能够获得更稳健的特征缩放结果。与 StandardScaler 缩放不同,异常值根本不包括在 RobustScaler 计算中。因此在包含异常值的数据集中,更有可能缩放到接近正态分布。

StandardScaler 计算公式如下(也叫标准差标准化 Z-Score):

x ′ = x − μ σ

你可能感兴趣的:(数学建模/大数据分析与可视化,Python,机器学习,特征标准化,RobustScaler,数据预处理)