python imblearn教程:不平衡数据处理

文章目录

        • imblearn介绍
        • 常见方法
          • 数据处理
        • 实例演示
          • 采样函数

imblearn介绍

官方教程:https://imbalanced-learn.org/stable/references/index.html

常见方法

不平衡数据的处理主要分为在数据层面的处理和在算法层面的改进,因为两者互不影响,所以也有结合两者的方法。首先进行数据处理,之后再进行算法预测。

数据处理
  • 过采样 over-sampling
    对少数类合成新样本,使得类别之间个数相等。

代表算法:SMOTE、ADASYN

  • 欠采样 under-sampling
    对多数类进行抽样,使得类别

你可能感兴趣的:(python机器学习和数据挖掘,python,决策树,pandas,gurobi,不平衡数据,imbalanced,data,imblearn)