centernet论文解读

目录

 

1、序言

2、论文

3、优势和劣势

3.1 优势

3.2 劣势

4、结论


1、序言

      conternet在19年刚出来的时候就对它特别感兴趣,后面遇到了FCOS,就把它遗忘了,但是centernet还是具有很多新颖的idea,值得分析一下。但最近看了一下论文以后突然对各种检测模型的界限不像以前划分的那么清了,什么两阶段和单阶段,anchor free 和anchor base在我看来主要还是在定义正负样本的区别,还有框的回归方式,anchor base会有个anchor box的先验知识,但实际上框的回归方式不重要。。。

2、论文

     论文中说大多数成功的目标检测器枚举了详尽的潜在的目标位置,这样十分的不高效,需要额外的后处理。这里的潜在目标位置就是定义的需要回归的正样本,像anchor base的就会计算GT和anchor box的IOU,大于阈值的定为正样本点进行回归。FCOS则是落到GT框里面的采样点都是正样本,再用center sample约束一下。实际上一个目标有多个正采样点负责回归它,再用NMS后处理剔除掉检测框冗余。centernet的检测器使用关键点去估计目标的中心点,然后去回归其他的属性(w和h),所以一个目标对应的正采样点只有一个,也就不需要NMS进行后处理了。这样就省去了后处理的计算量。

   论文先下采样,然后再上采样到4倍下采样得到feature map用了计算关键点和回归属性, 这里的4倍下采样feature map叫做heat map,然后把GT映射到这个4倍下采样的heat map上进行计算loss,映射的方法是用高斯核,如果高斯值重合了,则选择高斯值最大的那个进行回归。回归的属性有类别+中心点偏差+w和h。

3、优势和劣势

3.1 优势

   (1)少了nms

   (2)用关键点来定义正采样点,新颖。

3.2 劣势

   (1)类似yolov1,多个目标的中心点重合的时候,只能回归一个目标,大目标容易覆盖小目标。

   (2)虽然少了后处理,但是heat map用的是4倍下采样的feature map,计算量也是比较大的。

4、结论

     很有想法的论文,不是单纯的拼凑出来的论文,值得推崇。

 

你可能感兴趣的:(目标检测,人工智能,计算机视觉,深度学习,pytorch)