论文笔记-Loop Closure Detection for Visual SLAM Systems Using Deep Neural Networks

Xiang Gao, Tao Zhang,Loop Closure Detection for Visual SLAM Systems Using Deep Neural Networks, 2015
Xiang Gao, Tao Zhang,Unsupervised learning to detect loops using deep neural networks for visual SLAM system, 2015
虽然BoW等回环检测主流方法相对来说容易(并非百分百)避免false positive,但不擅长解决false negative,特别是光照、视角等影响下。

备注:
false positive(不相似的场景被判断为回环)和false negative (相似的场景没有被判断为回环)。

两个过程:
(1)无监督训练过程,形成特征,作者基于SDA (Bengio et al. 2013; Vincent et al. 2010)网络来做特征生成,
(2) 回环检测过程:通过比较两帧之间每个patch之间的相似性得到两帧之间的相似得分。两两得分最终可以组成一个相似矩阵。

无监督训练特征过程

x经过一个两层网络后的y仍然近似等于x,此时隐藏层的参数即是对应特征(隐藏层的维度大于输入x):

高博将整张图分为10x10的 图像块,则输入维度为100

在特征处理时,作者进行了改进:要兼顾位姿之间的连续性:
论文笔记-Loop Closure Detection for Visual SLAM Systems Using Deep Neural Networks_第1张图片
以及稀疏性和去噪。
最终目标函数为:
论文笔记-Loop Closure Detection for Visual SLAM Systems Using Deep Neural Networks_第2张图片

回环检测过程

即比较特征向量之间的一阶norm。但有一个处理:类似于TF-IDF,每个特征都除以自己在图像中的比例权重。
此外,对最终的相似矩阵,SVD分解降维,去掉特征值很大的一小部分向量(为什么是最大特征值?)能减少噪音。降维后的部分:
论文笔记-Loop Closure Detection for Visual SLAM Systems Using Deep Neural Networks_第3张图片

结果

精度大概70 %, 召回率大概50%.当然实际中需要检查周围连续帧是否也满足两两相关,所以作者认为50%的召回率可能足够了。

你可能感兴趣的:(SLAM)