论文阅读2(CVPR2019):Adaptive NMS:Refining Pedestrian Detection in a Crowd

原论文链接: Adaptive NMS:Refining Pedestrain Detection in a Crowd

针对行人检测中目标过于密集的问题,文中提出了一种自适应的非极大值抑制的检测方法,通过定义目标周围的密集程度采用不同的方法,并且设计了一个subnetwork去学习密集的置信度。该方法在单阶段和双阶段检测中都得到了较好的结果。
论文阅读2(CVPR2019):Adaptive NMS:Refining Pedestrian Detection in a Crowd_第1张图片
超市、机场和车站的人比较密集对于目标检测来说是一个不小的挑战,目前很多的检测方法在gt附近会产生很多的false postives,greedy NMS的作用是减少false postives的数量。然而也存在着很多问题,当阈值较小时很可能将高度重叠的目标丢失,反之,阈值太大会带来更多的false positive。如果说NMS是直接将和得分最大的box的IoU大于某个阈值时score置为0,那么soft NMS则不是将其置为0,而是替换为另一个score。虽然NMS 的很多改进在目标检测取得了不错的效果,但是对于拥挤的行人检测还是一个比较 困难,文中提出学习目标周围的密集程度。
论文阅读2(CVPR2019):Adaptive NMS:Refining Pedestrian Detection in a Crowd_第2张图片
为了更好的实现行人检测,NMS的设计应该考虑一下因素:(1)boxes是否远离目标,如果远离则误报的可能性较小,应该保留。(2)对于高度重叠的相邻检测,抑制的策略不仅取决于是否重叠还要看是否位于拥挤地区,如果位于拥挤地区,则高度重叠的很有可能是true positive,则应该给予较轻的处罚或者保留,但如果位于稀疏的区域,则应该给较高的惩罚。
density:
在这里插入图片描述
论文阅读2(CVPR2019):Adaptive NMS:Refining Pedestrian Detection in a Crowd_第3张图片
(1)当相连的box远离目标M时,则方法与NMS相同。
(2)当M位于密集区域时,则使用Adaptive NMS,会被保留。
(3)当M位于稀疏区域时,NM=Nt。(Nt是一个更高的阈值)
论文阅读2(CVPR2019):Adaptive NMS:Refining Pedestrian Detection in a Crowd_第4张图片
subnet可以用于单目标和双目标检测,首先通过1×1的卷积层进行降维,然后RPN预测的bb进行连接,最后用一个较大的卷积核(5×5)将周围的信息考虑进去。

你可能感兴趣的:(论文阅读2(CVPR2019):Adaptive NMS:Refining Pedestrian Detection in a Crowd)