ATSS论文解读

ATSS论文解读

    • 链接
    • 文章创新点
    • 详细解读

链接

论文地址:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection
github地址:ATSS

文章创新点

本文主要是通过对目标检测中的正样本的重新定义,通过重新定义的正样本来训练模型,最终使得模型能更好的学习到主要的特征。所以无需对模型本身做任何的修改,也无需对训练过程进行任何修改,只需调整输入到模型中的样本。

详细解读

论文主要阐述了对于正负样本的定义和选取对模型最终效果的影响。
首先是对比了anchor_free和anchor_base在选取样本时的差异,本文以RetinaNet和FCOS作为例子进行了对比,RetinaNet是采用IOU去选取正负样本,FCOS是基于空间分布对正负样本进行score。这两种采样方式会导致最终训练的正负样本是不一致的,作者通过对ReinaNet用两种不同采样方式进行训练模型,并对比起在COCO上的AP,验证anchor_base和anchor_free本质上的区别只是在于采样的不同。

regression Box Point
Intersection over Union 37.0 36.9
Spatial and Scale Constraint 37.8 37.8

然后提出本文的思想,自适应的选取正样本的方法,同时结合了上述两种的选取正样本方法,具体方法如下:
1.对于每个输出的检测层,选计算每个anchor的中心点和目标的中心点的距离,选取K个anchor中心点离目标中心点最近的anchor为候选正样本(candidate positive samples)
2.计算每个候选正样本和groundtruth之间的IOU,计算这组IOU的均值和方差
3.根据方差和均值,设置选取正样本的阈值:t=m+g m为均值,g为方差。
4.根据每一层的t从其候选正样本中选出真正需要加入训练的正样本。
5.训练模型。

本文的方法主要有两大特性:
1.保证了所有的正样本anchor都是在groundtruth的周围。
2.最主要是根据不同层的特性对不同层的正样本的阈值进行了微调。

作者采用本方法与之前的提取正负样本的训练方法进行了对比
ATSS论文解读_第1张图片
(未完待续)

你可能感兴趣的:(算法,人工智能)