论文阅读:Fast Point R-CNN

1. introduction部分

首先介绍传统的CNN面向图像数据来源,但是针对点云做深度学习在无人驾驶,机器人等领域是很有必要的。
然后说点云,太稀疏,奇异性大,不好直接做。那么有一种比较流行的处理手段就是:volumetric 体素化。 但是volumetric又有计算量太大的缺点。那么就有两种处理手段:

  1. use coarse grid: 粗的栅格化处理。这种方法的问题:无法利用fine-grained 的信息
  2. process point cloud directly for 3D object recognition:直接做处理。但是:笔者认为,即使这样,对于large-scale point cloud 仍然太重了

贡献

设计了一个两层3D object detection framework. 同时利用点云和voxel信息。
第一层网络叫VoxelRPN:直接面向voxel

第二层: 轻量的pointNet进一步提炼。第一层提供一个初始值。使用attention mechanism 将interior point coor 与 卷积特征 有效融合。这使得每个点附带周围环境信息。

三大贡献

2. related work

1. 三维空间信息表示

整体来说就是两种: 1. 体素格子 2. 直接点云表示

2. 3D Object Detection


文章框架数据流图
VoxelRPN
RefinerNet

3. Method

你可能感兴趣的:(论文阅读:Fast Point R-CNN)