IROS 2021最新开源!深度学习三维激光雷达动态物体分割

作者 | electech6
编辑 | 3D视觉开发者社区

文章目录

  • 导言
  • 内容简介

导言

大家好,今天给大家介绍的是德国波恩大学在读博士陈谢沅澧的最新工作。该方法的论文,代码,数据集以及视频都已经公开。

作者:Xieyuanli Chen

论文:
http://www.ipb.uni-bonn.de/pdfs/chen2021ral-iros.pdf

代码: https://github.com/PRBonn/LiDAR-MOS

数据集: http://bit.ly/mos-benchmark

视频: https://youtu.be/NHvsYhk4dhw

内容简介

以下是内容简介:

构建长期一致(consistent)的环境地图并区分其中正在运动和静止的部分对于移动机器人和自动驾驶汽车等智能移动平台而言至关重要,因为智能移动平台通常需要一致的环境地图来实现定位或规划路径。在进行导航过程中,智能移动平台也需要感知正在移动的物体,从而根据他们的运动特性进行规划和决策。在真实动态环境中,正在移动的行人、汽车和其他动态物体往往给移动智能平台进行环境地图三维重建或 SLAM 系统带来了巨大挑战。例如在建图过程中,正在运动的物体可能会造成地图的不一致并严重影响所生成的三维模型的质量。
IROS 2021最新开源!深度学习三维激光雷达动态物体分割_第1张图片

图1. 高速路场景中三维激光雷达(LiDAR)动态物体分割结果(红色部分为检测到的移动车辆)

因此,检测和分割传感器数据中的动态物体对于构建一致的环境地图、对无人平台进行状态预测、避免碰撞和路径规划而言至关重要。今天介绍的这篇工作旨在解决自动驾驶应用中的三维激光雷达运动物体检测和分割问题(LiDAR-based Moving Object Segmentation,LiDAR-MOS)。
IROS 2021最新开源!深度学习三维激光雷达动态物体分割_第2张图片

图2. 该方法使用距离图像来表述LiDAR数据,并使用CNN进行基于距离图像的动态物体分割,最终通过投影关系得到每个点的动态或静态标签,例如图中所展示的红色部分代表检测分割出的动态物体,黑色部分代表静态物体。

该工作提出了一种仅使用 LiDAR 进行运动对象分割的新方法,可以实现实时的激光雷达动态物体分割(LiDAR-MOS)。 该方法不是进行全类别语义分割,即预测多种语义类别,如车辆、行人、道路等,而是将场景分割为动态部分和静态部分,例如该方法可以区分正在行驶的汽车和停放在路边的汽车,如上图所示。

这篇论文所提出的方法利用3D LiDAR的连续距离图像作为结合卷积神经网络(CNN )的输入。该方法利用在类似图像的激光雷达表述上进行分割,因此不需要设计复杂的三维卷积神经网络。

这样做除了可以使用已有的 2D CNN框架外,相较于直接处理 3D 点云的方法,该方法运算速度很快,可以实现实时运行(20Hz)。 为了能够检测运动物体,在实际运用过程中,该方法使用序列距离图像信息。利用所提出的差异图(residual images)和新开放的数据集SemanticKITTI-MOS benchmark,通过时空信息结合的方式,该方法得到了很好的三维激光雷达动态物体分割结果。
IROS 2021最新开源!深度学习三维激光雷达动态物体分割_第3张图片

图3. 使用距离图生成的差异图像和新开放的LiDAR-MOS数据集来训练现有的CNN实现动态物体检测和分割。

本文还基于SemanticKITTI 构建并开放了基于 LiDAR 的动态物体分割的数据集用以对不同的动态分割算法进行评估。除了对动态物体分割结果进行评估外,本文还提供了两个相关的动态物体分割的应用场景,激光雷达里程计/SLAM以及激光雷达三维建图。
IROS 2021最新开源!深度学习三维激光雷达动态物体分割_第4张图片

图4. 左:原始点云聚合图,右:利用提出的LiDAR-MOS清理点云后所构建的地图
![在这里插入图片描述](https://img-blog.csdnimg.cn/b7605f7e7184408c9a9b9b37e0ed9b9c.png#pic_center)
图5. KITTI Odometry 数据集中不同算法的里程计定位结果

上图中所展示的是利用提出的动态物体分割算法简单地对SLAM输入进行预处理之后得到的定位和建图的结果。可以看到,仅仅使用所提出的LiDAR-MOS去除点云输入中的动态物体,而不需要改变任何SLAM细节,就可以对SLAM的定位和建图结果起到很大帮助。

如图4所示,在建图结果中使用该算法就可以很好的去除掉所谓”ghost“也就是由动态物体所导致的伪影。如图5所示,在定位结果中,使用动态物体检测提升SLAM的定位结果甚至超过了之前的使用全类别语义信息的SuMa++的定位结果。

使用该方法的另一个好处就是,该方法只是对点云进行了预处理就可以提高SLAM的定位和建图的结果,因此可以很轻松的移植到不同激光雷达SLAM算法中,大家只需要利用LiDAR-MOS动态物体分割滤除掉当前激光雷达中的动态物体就可以提升自己SLAM的性能。

该方法的论文,代码,数据集以及视频都已经公开。

版权声明:本文仅做学术分享,未经授权请勿二次传播,版权归原作者所有,若涉及侵权内容请联系删文。

3D视觉开发者社区是由奥比中光给所有开发者打造的分享与交流平台,旨在将3D视觉技术开放给开发者。平台为开发者提供3D视觉领域免费课程、奥比中光独家资源与专业技术支持。

点击加入3D视觉开发者社区,和开发者们一起讨论分享吧~

也可移步微信关注官方公众号 3D视觉开发者社区 ,获取更多干货知识哦!

你可能感兴趣的:(人工智能,深度学习)