python imblearn toolbox 解决数据不平衡问题(三)——under-sampling下采样
下采样即对多数类样本(正例)进行处理,使其样本数目降低。在imblearntoolbox中主要有两种方式:Prototypegeneration(原型生成)和Prototypeselection(原型选择)。前者生成不同于原正例样本的新的正例样本,后者对原正例样本进行筛选。一、Prototypegeneration算法即对多数类样本生成新的样本去替代原样本,使得样本数目减少,且新样本是生成的而不是