kaggle 欺诈信用卡预测——不平衡训练样本的处理方法 综合结论就是:随机森林+过采样(直接复制或者smote后,黑白比例1:3 or 1:1)效果比较好!
先看数据:特征如下:TimeNumberofsecondselapsedbetweeneachtransaction(overtwodays)numericV1NodescriptionprovidednumericV2NodescriptionprovidednumericV3NodescriptionprovidednumericV4NodescriptionprovidednumericV5