目标检测中的样本不均衡问题详述

样本不均衡问题:指在训练的时侯各个类别的样本数量不均衡,由于检测算法和数据集之间的差异,可能会存在正负样本,难易样本,类别间样本这三种不均衡问题。一般在目标检测框架中,保持正负样本的比例为1:3.

目标检测任务中,样本包括那些类别:

1.正样本:目标图像块

2.负样本:图像背景区域

3.易分正样本

4.易分负样本:实际情况中该类占的比重非常高。

5.难分正样本:这部分样本在训练过程中单个样本的损失函数较高,但是该类占总体样本的比例较小。

6.难分负样本

目前,解决样本不均衡问题的一些思路:

1.困难样本解决思路

1.OHEM:在线难例挖掘:主要针对训练过程中的困难样本自动选择;核心思想是根据输入样本的损失进行筛选。

2.S-OHEM:基于Loss分布采样的在线困难样本挖掘

3.Focal loss:专注难样本,改善了分类过程中的交叉熵函数,提出了可以动态调整权重的损失函数。

4.GHM:损失函数梯度均衡化机制,从样本的梯度范数出发,根据梯度范数所占比例进行动态加权。

2.正负样本解决思路:

1.ATSS:通过实验分析对比来说明正负样本分配的重要性,设计了一种mean IoU的方法。

2.SAPD:设计了一种利用注意力来软加权的训练策略,减少了对背景信息的锚点关注。

3.AutoAssign:将标签对齐看作一种连续问题,没有真正意义上的正负样本之分,每个特征图上都有正样本和负样本属性。只是权重不同而已。

4.DETR:将目标检测任务视为一个图像到集合的问题,使用Hungarian algorithm来实现预测值与真值实现最大的匹配,并且是一一对应。

3.类别间样本不均衡解决思路:

1.上采样和下采样的方法,增加少类别数目或者降低密集类别数量。

你可能感兴趣的:(目标检测中的样本不均衡问题详述)