【点云识别】RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds (CVPR 2020 Oral)

RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds

本文介绍一篇cvpr2020里面关于大场景下点云分割的文章。
论文
代码

1. 问题

为了解决的问题很直接,超大规模的点云分割

2. 思想

【点云识别】RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds (CVPR 2020 Oral)_第1张图片
网络架构如上,本文花了大量的时间论述针对超大规模的点云场景,目前只能使用随机采样这种快速的采样方法。 对比部分可以详见论文。
为了与随机采样这种方法相适应,作者相应的提出了Dilated Residual Block 模块作为基本单元,其中又包括Local Spatial Encoding 和 Attentive Pooling

3. 算法

3.1 Local Spatial Encoding

【点云识别】RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds (CVPR 2020 Oral)_第2张图片
也叫做point enrichment, 以点的坐标为基础,增加描述的属性,比较常见的操作。
【点云识别】RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds (CVPR 2020 Oral)_第3张图片

3.2 Attentive Pooling

不使用maxpooling这种比较简单的聚合操作
【点云识别】RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds (CVPR 2020 Oral)_第4张图片

4 实验结果

【点云识别】RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds (CVPR 2020 Oral)_第5张图片
在各个分割的数据集上表现都很棒,另一个关键优点是快!

总结

文章做的很棒,为了可以处理大规模舍弃了一些东西。
有几个关键trick值得注意:
1 knn的index是直接计算好的,仅根据x,y,z。
2 随机采样的时候有一个 local maxpooling的操作,论文中似乎没有提到。
3 充分的实验,在各个数据集上表现都很棒。
4 这些贡献在分类任务上不能算是优点,但是在大规模的分割任务下就具有优越性了。

你可能感兴趣的:(点云识别)