深度理解PyTorch的WeightedRandomSampler处理图像分类任务的类别不平衡问题
最近做活体检测任务,将其看成是一个图像二分类问题,然而面临的一个很大问题就是正负样本的不平衡问题,也就是正样本(活体)很多,而负样本(假体)很少,如何处理好数据集的类别不平衡问题有很多方法,如使用加权的交叉熵损失(nn.CrossEntropyLoss(weight=weight)),但是更加有效的一个实践是在模型训练的过程中过采样少数类样本,增加这些少数类样本被模型看到的频率。pytorch提供