关于物体位姿估计方法的总结,及其对应的论文

参考1:https://blog.csdn.net/dsoftware/article/details/97955570
参考2:基于单张RGB图像的三维物体重建和位姿估计_王凯祺
总体:
根据输入数据源,可以分为基于RGB,RGBD,点云的方法;
也可以分为传统方法,深度学习方法;
还可以分为基于关键点对应,直接回归,像素投票,模板匹配的方法。
一、基于对应的方法:
解决思路:我们已知目标物体在自身坐标系下的3D点,需要找到一种匹配方法,使得目标物体在当前相机坐标系下的一些关键点,与其在自身坐标系下的一些3D点,进行匹配,进而求出位姿。
1)2D-3D:如果输入的是2DRGB图像,可找到2D像素点和3D物体点之间的对应,进而使用PnP算法计算;
2)3D-3D:如果输入的是3D点云,则可以使用3D特征描述符寻找输入点云中3D点和已有完整物体3D点之间的对应,使用最小二乘法获得6D位姿;
两类输入都可以使用局部配准方法如ICP进行优化。

深度学习方法求物体的姿态:
1)2D深度学习方法:输入数据源为2D的RGB图片
直接回归6D姿态的PoseCNN: https://github.com/yuxng/PoseCNN(基于模板匹配的方法)
直接预测3D在2D投影点的Tekin et al.: https://github.com/Microsoft/singleshotpose(基于对应点的方法)
使用每个2D像素投票得到关键点2D投影的PVNet:https://github.com/zju3dv/pvnet(基于投票的方法)
2)3D深度学习的方法:

你可能感兴趣的:(深度学习,计算机视觉)