CenterNet : Objects as Points(MS COCO,KITTI,COCO)

CenterNet : Objects as Points(MS COCO,KITTI,COCO)

Abstract

  • 预测目标的中心点而不是目标框(通过检测关键点)
  • 端到端可微,相比anchor方法更快更精确
  • on MS COCO:28.1%AP at 142FPS, 37.4% AP at 52 FPS, 45.1% AP with multi-scale testing at 1.4 FPS.
  • 在KITTI 上的立体目标检测和COCO上的姿态检测任务中,仍然具有竞争力

Introduction

  • 使用边界框的中心点来表示目标,目标大小、维度、三维范围和姿态等信息从图像中心位置的特征中直接回归得到。检测问题变成了关键点预测问题。

  • 输入经过全卷积网络得到热图,热图中的极大值就是目标中心,对应位置的特征图中的特征向量就是目标框的长和宽(和深度)。

  • 网络可以在立体目标检测和姿态估计任务中使用

  • 相比anchor方法,centernet没有需要手动设定的IOU阈值,没有背景前景阈值,不需要NMS,输出分辨率高

  • 相比其他关键点方法(CornerNet、ExtremeNet),centernet在预测关键点之后不需要进行组合分组(cornerNet使用嵌入向量对关键点进行分组),速度大大提升

  • 文中使用了三种全卷积编解码网络预测热图,沙漏网络、上卷积残差网络、DLA网络

    [外链图片转存失败(img-iBv8Weyc-1567866143585)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561346811115.png)]

实验

在目标检测任务中,速度快,精度高,使用Hourglass-104的最慢,但是最精确。

使用DLA-34的最快,52FPS with 37.4%AP ,比YOLOV3快两倍,精确率更高(4.4%)

  • centernet 无法检测关键点重合的目标。但是其重合概率比起二阶段rpn的漏检率更低
  • 实验证明加入NMS对精度没有帮助,L1 loss 比 Smooth l1 loss 好用!?!?
  • [外链图片转存失败(img-E3qqzYS8-1567866143598)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1561345434767.png)]

你可能感兴趣的:(CenterNet : Objects as Points(MS COCO,KITTI,COCO))