DBOW词袋训练工具

代码:https://github.com/rabienrose/3d_vision/blob/master/visual_map/src/vslam/Examples/Monocular/create_vol.cc

启动脚本:https://github.com/rabienrose/3d_vision/blob/master/visual_map/create_voc_full.sh

说明:

  • 从多个目录中读取图片
  • 从所有图片中选取指定数量的图片用于训练bow的模型
  • 按照ORB-SLAM的建议,模型采用6层,10分支的配置(L=6, k=10)

安装

  1. 安装visual_map,见: https://blog.csdn.net/ziliwangmoe/article/details/93094754
  2. catkin build vslam

使用

  1. 执行文件:/devel/lib/bag_tool/bag_tool_exe
  2. 参数1:输出的模型的文件名,比如FREAKTest.bin
  3. 参数2:描述类型,"freak"或者"orb"
  4. 参数3:最终使用的图片数量
  5. 参数4:模型的分支数
  6. 参数5:模型的层数
  7. 参数6+:数量不限个图片的文件夹,图片文件名任意

测试:

  1. 选取三条街区,以及地下停车库的图片,一共13组图片。大概3w+。程序选出3000张左右。
  2. 生成的orb模型大概30多MB,freak模型大概60多MB
  3. 用orb-slam作者提供的orb模型的效果和用跑slam的图片生成的模型的效果差不多
  4. 用其他视频生成的模型效果比用跑slam的图片生成的模型差
  5. 用上面三条街区的数据生成的模型效果还是比不上orb-slam作者提供的orb模型
  6. 但生成的freak的模型,效果都没什么问题。
  7. 效果的评价是通过orb-slam中的回环检测的成功率来看。

结论

  1. 目前有概率程序会crash,应该是内存越界的问题,后面需要解决。
  2. 还需要更加精确和详细的对训练方法的研究

你可能感兴趣的:(VisualMap)