基于深度学习的视觉SLAM综述

下面来介绍一下深度学习的视觉SLAM综述,具体如下:

同时定位与地图构建(SLAM)是机器人搭载视觉、激光、里程计等传感器,对未知环境构建地图的同时实现自定位的过程,在机器人自主导航任务中起着关键作用。当前SLAM问题的研究手段主要是通过在机器人本体上安装多类型传感器来估计机器人本体运动信息和未知环境的特征信息,利用信息融合实现对机器人位姿的精确估计以及场景的空间建模。尽管SLAM采用的传感器有激光和视觉等多种类型,但其处理过程一般包含2个部分。前端帧间估计和后端优化。前端帧间估计解决的是机器人在获取前后2帧传感器信息的时间间隔内的运动估计,而后端优化解决的是机器人检测到路径闭环后对历史轨迹的优化问题。考虑到里程计等传感器信息积累的误差,后端优化就变得尤为重要,其关键是正确的检测闭环。相对于激光传感器单一的空间结构感知信息,视觉传感器凭借其丰富的色彩和纹理等感知信息在提高帧间估计精度和闭环检测正确率方面有着巨大的优势和潜力。

视觉SLAM(visual SLAM)是以图像作为主要环境感知信息源的SLAM系统,可应用于无人驾驶、增强现实等应用领域,是近年来的热门研究方向。典型视觉SLAM算法以估计摄像机位姿为主要目标,通过多视几何理论来重构3D地图。为提高数据处理速度,部分视觉SLAM算法首先提取稀疏的图像特征,通过特征点之间的匹配实现帧间估计和闭环检测,如基于SIFT(scale-
invariant feature transform)特征的视觉SLAM和基于ORB(oriented FAST and rotated BRIEF)特征的视觉SLAM。SIFT和ORB特征凭借其较好的鲁棒性和较优的区分能力以及快速的处理速度,在视觉SLAM领域受到广泛应用。但是,人工设计的稀疏图像特征当前有很多局限性,一方面如何设计稀疏图像特征最优地表示图像信息依然是计算机视觉领域未解决的重要问题,另一方面稀疏图像特征在应对光照变化、动态目标运动、摄像机参数改变以及缺少纹理或纹理单一的环境等方面依然有较多挑战。面对这些问题,在视觉SLAM领域近年出现了以深度学习技术为代表的层次化图像特征提取方法,并成功应用于SLAM帧间估计和闭环检测。深度学习算法是当前计算机视觉领域主流的识别算法,其依赖多层神经网络学习图像的层次化特征表示,与传统识别方法相比,可以实现更高的识别准确率。同时,深度学习还可以将图像与语义进行关联,与SLAM技术结合生成环境的语义地图,构建环境的语义知识库,供机器人进行认知与任务推理,提高机器人服务能力和人机交互的智能性。

通过前述分析,深度学习与SLAM的结合主要体现在3个方面,即基于深度学习的帧间估计、闭环检测和语义地图生成。因此,通过深度学习与帧间估计的结合,主要涉及基于光流图像的深度学习帧间估计。其次,深度学习与闭环检测的结合,主要涉及深度学习特征提取以及位置识别。最后,综述了深度学习与语义地图生成的结合,主要涉及利用深度学习对静态场景和动态场景进行语义分割。基于这三个方面的详尽调研,将深度学习SLAM算法和传统SLAM算法进行了深入对比,分析了当前算法尚存的问题与不足,并指出了未来的发展趋势和方向。

闭环(loop closure)检测是指机器人在地图构建过程中,通过视觉等传感器信息检测是否发生了轨迹闭环,即判断自身是否进入历史同一地点.闭环检测发生时可触发SLAM后端全局一致性算法进行地图优化,消除累积轨迹误差和地图误差。闭环检测问题本质上是场景识别问题。传统方法通过人工设计的稀疏特征或像素级别稠密特征进行匹配,而深度学习则可以通过神经网络学习图像中的深层次特征,其识别率可以达到更高水平。因此,基于深度学习的场景识别可以提高闭环检测准确率。

 

你可能感兴趣的:(技术沙龙,深度学习,深度学习算法馆)