pandas数据的异常值判断、可视化以及异常值的处理

文章目录

    • 异常值的判断
      • 使用均值和标准差进行判断
      • 使用上四中位数和下四中位数进行异常值判定
    • 通过可视化进行异常值分析判断
    • 异常值处理
    • 参考文献

异常值的判断

使用均值和标准差进行判断

  • mean 为数据的均值
  • std 为数据的标准差
  • 数据的正常范围为 【mean-2 × std,mean+2 × std】

接下来我们使用代码来看看

import pandas as pd
import numpy as np

tips = pd.read_csv('tips.csv'

你可能感兴趣的:(机器学习,pandas,异常值判断)