分类预测 | MATLAB实现RUSBoost自适应提升随机欠采样的不平衡数据分类预测

分类预测 | MATLAB实现RUSBoost自适应提升随机欠采样的不平衡数据分类预测

目录

    • 分类预测 | MATLAB实现RUSBoost自适应提升随机欠采样的不平衡数据分类预测
      • 基本描述
      • 研究回顾
        • 样本采样技术
        • 集成学习技术
      • 程序设计
      • 参考资料
      • 致谢

基本描述

数据不平衡分类是对各类别间样本的数目相差较大的数据集进行分类。例如:二分类问题中,一个样本总数为100,80个样本被标为类别1,剩下的20个样本被标为类别2。类别1比类别2的样本总数为4:1。这是一个不平衡的数据集。实际生活中,故障检测,癌症检测,石油勘探都是不平衡数据。

  • RUSBoost是一个非常简单的针对不平衡数据集的算法,算法如其名,就是RUS+Boost
  • RUS(random undersampling):随机欠抽样,随机从数据集中抽取一定量的多数类样本和少数类组成平衡分布的训练数据集
  • Boost:指的是 Ada

你可能感兴趣的:(分类预测,#,XGBoost极限梯度提升树,#,GBDT梯度提升树,RUSBoost,自适应提升随机欠采,不平衡数据,分类预测)