【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection

最近在读的一篇tracking的文章用到了这个网络,所以了解一下。
论文连接:IoU-Net


Motivation:

1. 目标检测分为分类回归两个任务,目前的范式是:先用分类在多个候选框中挑出置信分数最高的,然后对其进行回归得到最终的目标框。然而,在这一流程中,分类网络对最后框的挑选占据了主导作用,回归的重要性在一定程度上被忽视了。这么做的一个缺陷在于,当分类的置信度与定位(回归)的准确度不匹配时,会导致定位更准确的边界框在 NMS 过程中反被更不准确的边界框抑制。比如下图:
【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection_第1张图片回归得更精确的框(绿框),因为在分类置信度上略低于红框,在NMS得过程中会被抑制掉,产生一种“劣币驱逐良币”的现象。

2. 缺乏定位置信度使得被广泛使用的边界框回归方法缺少可解释性可预测性。比如,常用的迭代式边界框回归方法,随着迭代轮次的增加,在定位精度上不一定是单调增加的。所以,如果粗暴的多次应用边界框回归,可能会降低回归精度。
【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection_第2张图片


Contributions:

1. 针对第一个问题,作者提出了一种IoU引导式的NMS方法(IoU-guided NMS),不再将同一个框的分类置信度和定位置信度绑定。而是用定位置信度作为NMS的排名依据,将其匹配上附近框中最高的分类置信度。这样就可以消除由误导性的分类置信度所造成的抑制错误。

2. 针对第二个问题,作者提出了一种基于优化的边界框修正流程(Optimization-based Bounding Box Refinement)。简而言之,这种方法在预测某一个框的IoU的同时,能够利用预测网络的反向梯度通过梯度上升求解边界框的优化。


IoU-guided NMS

这一部分在文章的3.2节,其实看懂这个算法图就能明白,关键的三个地方做了注释。
【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection_第3张图片


Optimization-based Bounding Box Refinement

这一部分作者的精妙之处在于,重复利用了用来预测定位置信度的网络IoU-Net。通过求IoU-Net的反向梯度,可以从梯度上升的方向优化候选框。(不要被算法2中的那几个IoU和PrPool唬住了)

这个算法其实也存在迭代过程,但是与常用的迭代式边界框回归方法相比,首先它用到了梯度上升优化,每一次的迭代过程不同;其次由于迭代循环终止条件的存在,可以在最优IoU的时候停止边界框的修正,避免了迭代式边界框回归的非单调性对定位精度的损害。
【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection_第4张图片


IoU-Net

以下是实现IoU预测的网络,文章中有详细的参数介绍。
【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection_第5张图片

你可能感兴趣的:(【目标检测】IoU-Net:Acquisition of Localization Confidence for Accurate Object Detection)