基于深度学习的VO个人想法

基于深度学习的VO

另一篇博客【室外场景的SLAM方法】中写了自己对深度学习VO的不看好。但也不可否认,基于深度学习的VO获得了广泛关注,包括ICRA2019上就有几篇文章。基于深度学习的单目VO的图优化(2019ICRA)

实验中的发现

一个对比逻辑,只跟ORB-SLAM2的单目(更过分的是非要和没有回环检测的单目)比较,因为这类方法它根本比不过原本的单目回环更别说双目了,但是逻辑也没有问题,因为我的方法也没有回环啊,也没有用双目啊,而是单目VO啊;
但问题是你用的神经网络更耗时啊,精度又达不到双目VO的精度。为什么这么做呢???
虽然这么质疑,可是没有调查就没有发言权

单目VO

目前分为两种:基于几何方法的和基于学习的

ps:忽然发现这么看来自己目前还是个保守派

  • 基于几何的VO
    几何方法通常是通过图像特征或光度重投影,然后在线误差最小化来解决。

  • 基于学习的VO
    该方法是通过大量图像序列驱动的端到端深度神经网络离线训练来解决。
    2019 ICRA
    2018 arXiv
    2019 单目深度预测
    2018 DVSO
    2017 CVPR
    2017 CVPR
    很多都是直接由单目图像可以输出深度图和相机位姿。

  • 目前认为基于深度的VO较基于几何的VO的优点:

    • 不需要参数调优
    • 对尺度漂移和跟踪更为鲁棒
    • 在训练阶段利用双目图像从单目图像中恢复尺度
    • 在直接集成语义信息以实现鲁棒的相机跟踪方面具有很大的潜力

第三条不也说了嘛,你达到100%的准确率才和双目一样啊。而第四条,就像前篇博客提到的,用轻量的深度学习辅助SLAM就可以了,也不用把这么关键的定位一起交出去吧。

但也不得不承认,如果失去回环检测(就像很多场景中它没有必要去回环),基于几何的SLAM定位确实很差,所以也有提出基于线、面、物体级的SLAM方法,用来修正这一缺陷,如同为2019年的CubeSLAM以及CubeSLAM与POP-up SLAM结合起来的物体级语义SLAM。【click here】.

你可能感兴趣的:(V-SLAM)