《论文阅读15》A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR

  一、论文

  • 研究领域:用于雷达点云全景分割的聚类方法综述
  • 论文:A Technical Survey and Evaluation of Traditional Point Cloud Clustering
    Methods for LiDAR Panoptic Segmentation[参考]
  • ICCVW21 

  • 论文链接
  • 论文github

二、论文简述

我们是第一个提出解决全景分割与传统的点云聚类算法,选择最先进的语义模型Cylinder3D [45,47]来提供每个点的语义标签。然后,我们运行各种LiDAR聚类算法,以获得每个对象的实例标签。

在语义分割之后,聚类算法对对象点工作以进一步分割每个实例。

《论文阅读15》A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR_第1张图片

《论文阅读15》A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR_第2张图片

《论文阅读15》A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR_第3张图片

三、论文详述

  • 摘要

LiDAR全景分割是一项新提出的自动驾驶技术课题。与流行的端到端深度学习解决方案相比,我们提出了一种混合方法,该方法使用现有的语义分割网络来提取语义信息,并使用传统的LiDAR点云聚类算法来分割每个实例对象。我们认为基于几何的传统聚类算法值得考虑,因为它在SemanticKITTI数据集的全景分割排行榜上显示了所有已发布的端到端深度学习解决方案中最先进的性能。据我们所知,我们是第一个尝试点云全景分割与聚类算法。因此,我们没有在新的模型上工作,而是在本文中通过实现四种典型的聚类方法给予全面的技术调查,并在基准测试上报告它们的性能。这四种聚类方法是最具代表性的,具有实时性。在本文中,它们是用C++实现的,然后包装成Python函数,以便与现有的深度学习框架无缝集成。我们发布我们的代码给可能对此问题感兴趣的同行研究人员。

语义分割

《论文阅读15》A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR_第4张图片

实例分割

实例分割只对图像中的目标(如上图中的人)进行检测和按像素分割,区分不同实例(使用不同颜色)

全景分割(panoptic segmentation)

语义分割和实例分割的结合,即要对所有目标都检测出来,又要区分出同个类别中的不同实例。

实例分割只对图像中的目标(如上图中的人)进行检测和按像素分割,区分不同实例(使用不同颜色),而全景分割是对图中的所有物体包括背景都要进行检测和分割,区分不同实例(使用不同颜色)。

《论文阅读15》A Technical Survey and Evaluation of Traditional Point Cloud Clustering Methods for LiDAR_第5张图片

  • Introduction

全景分割是静态对象的语义分割和可数对象的实例分割的集成。点云全景分割需要为每个点提供语义标签id,并进一步为属于同一对象的点分配唯一的实例标签[27]。通过理解单帧LiDAR扫描的语义和实例信息,该任务能够为高级自动驾驶功能提供许多有用的线索,例如未来预测[16]和地图构建[7]。

动机。大多数现有的工作都是通过端到端的深度学习模型来解决LiDAR全景分割问题神经网络负责逐点分类和逐点聚类。目前,几乎所有的分类任务都由神经网络主导。然而,考虑到点云中隐含编码的3D几何信息,神经网络是否同时擅长聚类是值得怀疑的。至少,我们应该评估几个问题,而不是直接应用神经网络作为解决方案。例如,我们真的需要神经网络进行逐点聚类吗?如果需要,神经网络解决方案能比传统方法强多少?回答这些问题需要一个坚实的基准来调查和比较现有的传统聚类方法在公认的数据集。这促使我们准备这篇关于SemanticKITTI点云全景分割任务的传统点云聚类方法的技术综述论文。

点云聚类是多个领域研究的主题,包括机器人[43]和智能交通[34]。该技术已被用于各种应用。例如,一些最近的点云压缩方法需要聚类算法来下采样点[37,38]。非学习聚类算法也被证明用于一些标准任务,如语义分割[22]和对象检测[44]。

在本文中,我们建议只依赖于现有的神经网络的语义分类部分,然后处理的逐点聚类部分与传统的激光雷达聚类算法。据我们所知,我们是第一个提出解决全景分割与传统的点云聚类算法。因此,与其开发新技术,我们宁愿进行全面的技术审查,以调查所有现有方法的性能。具体来说,我们选择最先进的语义模型Cylinder3D [45,47]来提供每个点的语义标签。然后,我们运行各种LiDAR聚类算法,以获得每个对象的实例标签。Cylinder3D具有开放源代码,带有预训练的检查点,因此我们可以很容易地使用相同的语义模型在不同的聚类方法之间进行公平的比较。

在这种设置下,我们评估了我们在著名的semanticKITTI数据集[3,27]上实现的各种代表性聚类方法。我们将在第三节中讨论关于每种选择的聚类方法的更多细节。与标准的全景分割相同,PQ(全景质量)被用于测量聚类方法的全景性能。我们还报告了SemanticKITTI中使用的其他指标与排行榜上的方法进行比较。

我们提出了一个新的框架LiDAR全景分割。我们是第一个证明解决LiDAR全景分割的语义网络和传统的聚类方法的可能性。此解决方案优于最近发布的所有端到端网络解决方案。经典的聚类方法在CPU上以毫秒级运行,减轻了实例部分的标记工作,并且有机会更好地适应新的未见场景,因为它没有偏向于训练集。作为一种传统的方法,它不是一个网络式的黑箱,从而使人们清楚地知道该方法的性能何时更好或更差。

我们建立了一个基准的激光雷达聚类算法。激光雷达聚类方法的一个问题是由于存在大型非物体表面,如墙壁和地面,评估指标的模糊性。在本文中,我们过滤掉所有这些非对象点,通过使用已发布的代码和检查点2的语义模型。因此聚类算法只能集中在属于对象的点上。我们进一步使用广泛认可的评价指标[36,30]来直接评估和比较不同聚类方法的有效性。由于SemanticKITTI数据集和排行榜的高质量[3,27],未来关于LiDAR聚类主题的研究可以遵循我们的基准作为事实上的比较基线。

你可能感兴趣的:(科研论文,论文阅读)