论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案

机器人建图与定位是一个炙手可热的方向,已经有千千万万人前赴后继地投身到以SLAM(同步建图与定位)为代表的相关技术的研究之中。
虽然现在已经有很多出色的模型(如ORB-SLAM),然而基于单目视觉的SLAM仍然无法获得足够的精度,无法完美地解决漂移的问题。此外,对于一些人多的场景,机器人身上的一些相机时也可能被遮挡,导致机器人无法提取足够多的环境特征从而使视觉定位系统失效。
这里跟大家分享一篇2018年10月的文章StreetMap - Mapping and Localization on Ground Planes using a
Downward Facing Camera,X. Chen et al.采取了一种不太常见的思路,利用面向下的相机进行机器人的建图和定位,巧妙地避免了上述问题,获得了不错的效果。

在这篇文章里,作者提出了两个系统:基于特征的系统基于线的系统

基于特征的系统

整体思路
在一些场景中,地面具有比较丰富独特的纹理(如下图)。这就允许我们进行图片的匹配和检索。因而作者首先通过一个探索阶段级联地建立一个地面的全局地图,随后实时地基于地图进行定位。

论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案_第1张图片
适用的场景

地图
作者用一系列的图像和对应的相机位姿表示地图,通过相邻关键帧之间的单应性变换估计来计算每一个新时刻的位姿,同时结合回环检测进行全局的优化。
定位
有了全局地图,我们就可以进行全局初始化和重定位。方法是在地图(图库)中利用BoW(Bag of Words,词袋)方法检索与当前视野最匹配的一些帧,随后估计与这些最匹配的帧的相对变换。

论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案_第2张图片
方法框架

效果

论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案_第3张图片
效果展示

基于线的系统

整体思路
除了特征点,直线也是常见的地面特征。针对于一些具有方形图案的地面(如下图),作者设计了一个基于线的系统。

论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案_第4张图片
适用场景

基于 方形图案的假设,作者让所有的线都与坐标轴平行,并用一个四维向量表示一条线段:取值为(与轴平行)或者(与轴平行),若,那表示线段的坐标,表示线段坐标的取值范围。建图时,我们不断更新地图图中的线;定位时,地图中的线是固定的。

方法框架

论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案_第5张图片
方法框架

每次监测到一条线段,首先将其投影到全局坐标,并将其与现有的(侯选库和地图上的)线段匹配,如果没有匹配上,就把这条新的线段放到候选库中;如果匹配到了候选库中的线段,将线段计数+1,等到计数足够大就把线段加入到地图中;如果匹配到了地图上的线段,则利用扩展卡尔曼滤波器估计新的位姿。

效果展示

论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案_第6张图片
效果展示

总结

这篇文章中,作者提出了分别基于特征和基于线的两个系统。基于特征的系统的方法框架是我们十分常见的机器人室内定位套路,即离线建图-在线匹配检索-位姿估计,适用于地面有丰富的独特纹理的场景(然而个人认为大部分的室内场景比较难要求地面的纹理有较高的随机性,会导致定位出现多个可能的位置);基于线特征的系统做出了方形图案的假设,有助于减小漂移现象,但是对于方形太大或者太小的情形,仍然需要结合其他传感器进行定位。这种基于线的方法让笔者联想到一种基于建筑结构线的SLAM方案-StructSLAM,感兴趣的可以去看一下。(可以参考StructSLAM: Visual SLAM With Building Structure Lines)

更多关于机器人视觉定位和计算机视觉的文章:
图像分割:全卷积神经网络(FCN)详解
基于视觉的机器人室内定位
目标检测:YOLO和SSD 简介

你可能感兴趣的:(论文阅读:StreetMap-基于向下摄像头的视觉建图与定位方案)