【文章阅读】STD:Sparse-to-Dense 3D Object Detector for Point Cloud

Brief

很新的一篇做检测的文章,是腾讯优图和港科大的联合工作。19年7月22号放在了arxiv上面。

Abstruct

  • STD(sparse-to-dense),two-stage的方法。

(1)第一阶段是对raw-data数据进行一个椭圆的anchor生成一个精确的proposal。这个工作可以做到使用较少的时间到达high recall的结果。然后,利用PointsPool将proposals的内部点特征从稀疏表达转化为紧凑表示,从而生成proposals的特征,从而节省了更多的计算时间。(大体思路是voxelnet这一套,改变了anchor的形态和提取方法)
(2)第二阶段,作者采用了一个并行的IOU分支来提高定位准确性的感知,进一步提高分类的表现。

  • sota 在kitti,并且有很高的帧率

1. Introduction

  • 老生常谈,略过。记录一下写的比较好的观点:

写voxelnet系列时说他们的缺点:
Although efficient, information loss is inevitable, degrading localization quality.

  • 作者的贡献:

(1)作者采用的anchor是球形的,采用的也是PointNet++先进行上下文语义信息提取(这不是该作者的另外一篇文章IPOD的思路吗)。
(2)为了得到给一个proposal的特征信息,作者提出了pointpool(结合内点的正则坐标和其对应的语义信息),从而转化为有序的表达。
(3)在第二阶段,作者在预测和gt之间采用了一种新型的3D IOU方式来减轻压力。

2. Related Work

这就是IPOD的内容,可能是那篇文章的改进版本吧

3. Our Framework

  • 作者的工作充分利用了point的voxel的方法:

Our method is a two-stage 3D object detection framework exploiting advantages of voxel- and point-based methods.

  • network overview:
    【文章阅读】STD:Sparse-to-Dense 3D Object Detector for Point Cloud_第1张图片

(1)第一个阶段PGM是通过一个man-made的球形anchor生成一个proposal(这就和voxelnet系列不一样了,voxelnet系列都是预先定义一个anchor每个anchor一个proposals,而不是要生成一个proposal,最大的区别是:voxelnet系列的特征是以小size的anchor为单位的,而这一篇文章则是以一个“proposal”提取的),作者是先通过语义信息对每一个点生成一个球形anchor,再通过nms得到最终的分类proposals,接下来是pointpool层得到每一个proposals的特征,采用的是VFE。
(2)第二阶段则是作者的IOU Branch和Box Prediction Branch的结合。(感觉这才是巨大的创新)。

3.1 Proposal Generation Module

  • 作者说,他采用的是基于每一个点的生成的策略:

We instead design a generic strategy to seed anchors based on each point independently, which is the elementary component in the point cloud。
这种情形一般是这么做:先进行场景的语义分割(pointnet++),然后对分割的结果选所谓的“seed”。

  • challenge

同IPOD

  • Spherical Anchor

(1)作者提到,球形的anchor相当于会有任何方向,而柱体的则不是。对于每一个人工球形的anchor,作者设计不同大小的半径(车–2m,人–1m);而由每一个anchor所预测的proposal是根据圈圈内的点的(这不就是生成的方法吗)。每一个框都和其内点相关,但是却是有着一个预定义的大小。

你可能感兴趣的:(深度学习-点云基础网路-分类,CV-Detection)