机器学习新手如何应对数据集不平衡的情况?

1、增加少数类别的样本数量,可以通过复制样本或使用SMOTE(Synthetic Minority Over-sampling Technique)等技术生成新的样本

2、减少多数类别的样本数量,可以通过随机删除样本或使用CV(Cross-Validation)等技术

3、使用专门处理不平衡数据的算法

4、使用集成学习方法,如Bagging、Boosting等

你可能感兴趣的:(机器学习,人工智能)