作者:Baichuan Huang1,2, Jun Zhao1Jingbin Liu2
1 Nanyang Technological University, Singapore 新加坡南洋理工大学
2 Wuhan University, Wuhan, China 武汉大学
同时定位与地图(SLAM)实现了基于自我感知的同时定位和地图构建。本文综述了激光雷达SLAM、视觉SLAM及其融合技术。
本文的贡献可以总结如下:本文提供了一个高质量和全面的SLAM概述。对于新的研究人员来说,掌握SLAM的发展并非常清楚地了解它是非常友好的。此外,本文还可以作为有经验的研究人员寻找新的兴趣方向的词典。
SLAM包含两个主要任务:定位和映射。
这是移动机器人技术中一个重要的开放性问题:要精确移动,移动机器人必须拥有精确的环境地图;然而,为了绘制精确的地图,移动机器人必须精确地知道感应位置。先来的是鸡还是蛋?(地图还是运动?)
1990年,[2]首次提出使用EKF(扩展卡尔曼滤波器)来增量估计机器人姿态的后验分布以及地标的位置。
定位技术取决于环境和对成本、精度、频率和鲁棒性的要求,可以通过GPS(全球定位系统)、IMU(惯性测量单元)和无线信号等实现[3],但GPS只能在室外正常工作,IMU系统存在累积误差[5]。无线技术作为一种主动系统,无法在成本和准确性之间取得平衡,SLAM应运而生。
目前基于图优化的SLAM占主导地位,发展历程:基于卡尔曼滤波(KF)-- 基于扩展的卡尔曼滤波(EKF)-- 基于粒子滤波(PF)
单线程被多线程取代,SLAM技术从军用原型转变为多传感器融合机器人应用
1991年,[1]使用多个伺服安装的声纳传感器和EKF滤波器为机器人配备SLAM系统。从声纳传感器开始,激光雷达的诞生使SLAM系统更加可靠和健壮。
分类:
按照激光雷达光束的数量:二维激光雷达,三维激光雷达
按照生产工艺:机械式激光雷达,微机电(MEMS)混合式固态激光雷达,固态激光雷达
品牌:
Velodyne,SLAMTEC,Ouster,Quanergy,Ibeo。其他激光雷达公司包括但不限于sick、Hokuyo、HESAI、RoboSense、LeddarT ech、ISureStar、benewake、Livox、Innovusion、Innoviz、Trimble、Leishen Intelligent System。
小型化、轻量化的固体激光雷达将占据市场,满足大多数应用
激光雷达SLAM系统在理论和技术上都是可靠的
1.Gmapping (2003)
基于FastSlam[9][10]的网格地图的改进版本,它是基于RBPF(Rao Blackwellisation Particular Filter)方法的机器人中使用最多的SLAM软件包。增加了扫描匹配方法来估计位置
2.HectorSlam(2011)
结合了二维SLAM系统、三维导航、扫描匹配技术和惯性传感系统
3.KartoSLAM(2010)
一个基于图形的SLAM系统
4.LagoSLAM(2012)
基本思想是基于图的SLAM,即非线性非凸代价函数的最小化
5.CoreSLAm(2010)
一种性能损失最小的算法
6.Cartographer(2016)
来自谷歌,采用子映射和循环闭包来实现更好的产品级性能。该算法可以跨多个平台和传感器配置提供二维和三维SLAM
1.Loam(2014)
使用3D激光雷达进行状态估计和映射的实时方法[16]。它也有来回旋转版本和连续扫描二维激光雷达版本
2.Lego-Loam(2018)
从Velodyne VLP-16激光雷达(水平放置)接收点云和可选IMU数据作为输入。系统实时输出6D姿态估计,具有全局优化和闭环功能
3.Cartographer(2016)
它支持2D和3D SLAM
4.IMLS-SLAM(2018)
基于扫描层析模型匹配框架,提出了一种仅基于三维激光雷达数据的低漂移SLAM算法
特征提取和目标检测:
1.PointNetVLAD(2018)
允许端到端训练和推理从给定的3D点云中提取全局描述符,以解决基于点云的位置识别检索问题
2.VoxelNet(2018)
一个通用的3D检测网络,它将特征提取和目标框检测统一为一个单阶段、端到端可训练的深度网络。其他工作可以在BirdNet[21]中看到
3.LMNet(2018)
高效的单级深度卷积神经网络,用于检测对象,并输出对象度贴图和每个点的边界框偏移值
4.PIXOR (2018)
无proposal的一阶段检测网络,可输出从像素级神经网络预测解码的定向3D对象估计
5.YOLO3D(2018)
YOLO2D的升级版,建立在二维透视图像空间中一次性回归元体系结构的成功基础上,并将其扩展到从激光雷达点云生成定向三维对象边界框
6.PointCNN(2018)
通过卷积层来学习输入和输出之间的X-transformation
7.MV3D(2017)
融合的网络框架,将点云和RGB图像作为输入,并预测定向3D边界框
8.PU-GAN(2018)
一种基于生成对抗网络(GAN)的新点云上采样网络(CVPR2018)
识别与分割:
三维点云的分割方法可以分为基于边缘的、区域生长的、模型拟合的、混合方法的、机器学习应用的和深度学习的[29]。本文重点介绍了深度学习的方法
1.PointNet(2016)
设计了一种新型的直接消耗点云的神经网络,它具有分类、分割和语义分析的功能
2.PointNet++(2017)
通过不断增加的上下文规模学习层次结构特征
3.VoteNet(2019)
为点云构建了一个3D检测通道,作为一个基于PointNe++t的端到端3D目标检测网络
4.SegMap(2018)
一种基于3D点云中线段提取的定位和映射问题的地图表示解决方案
5.SqueezeSeg(2018-2019)
是一种卷积神经网络,带有循环CRF(条件随机场),用于从3d激光雷达点云中实时分割道路对象
6.PointSIFT(2018)
一个用于3D点云的语义分割框架。它基于一个简单的模块,从八个方向的相邻点提取特征。
7.PointWise(2018)
提出了一种卷积神经网络,用于3D点云的语义分割和对象识别。
8.3P-RNN(2018)
一种新颖的端到端方法,用于沿两个水平方向进行非结构化点云语义分割,以利用固有的上下文特征。
9.SegMatch(2017)
一种基于3D片段检测和匹配的循环闭合方法
10.KdNetwork(2017)
为3D模型识别任务而设计的,适用于非结构化点云。
11.DeepTemporalSeg(2019)
提出了一种深度卷积神经网络(DCNN),用于对具有时间一致性的激光雷达扫描进行语义分割。
12.LU-Net(2019)
实现了语义分割功能,而不是应用一些全局3D分割方法
13.PointRCNN(2019)
定位:
1.L3-Net
一种新型的基于学习的激光雷达定位系统,可实现厘米级的定位精度。
2.SuMa++
计算整个扫描的逐点标签中的语义3分割结果,允许我们使用标记的表面构建语义丰富的地图,并通过语义约束改进投影扫描匹配。
成本与适应性
激光雷达可以提供3D信息,不受夜间和光线变化的影响,视角相对较大,可以达到360度,但激光雷达的技术门槛很高,导致开发周期长,成本高。在未来,小型化、成本合理、固态化、实现高可靠性和适应性是发展趋势。
少纹理和动态环境
长走廊、大管道等少纹理环境也会给激光雷达SLAM带来麻烦,如何使激光雷达SLAM对低纹理和动态环境具有更强的鲁棒性,以及如何保持地图的更新,是需要更深入考虑的问题。
对抗性传感器攻击
深层神经网络容易受到敌对样本的攻击,这在基于摄像头的感知中也得到了证明。但在基于激光雷达的感知中,它非常重要,但尚未被探索,有相关研究和成果表明,将对抗任务看作优化问题然后设计对抗模型的方法可以使得攻击成功率提高到75%。点云对抗样本的的不可见不易预防,使得以及SLAM系统的安全性可以作为新的研究方向。