论文解析 - ElasticFusion: Dense SLAM Without A Pose Graph

ElasticFusion: Dense SLAM Without A Pose Graph

 

该文章发布于2015年,RSS。

该文章也属于帝国理工Andrew Davison实验室的套餐之一,这篇文章是理解SemanticFusion的重要参考文章。

其实他们还有一个祖宗叫KinectFusion,有机会再看看。

 

核心梳理

III. FUSED PREDICTED TRACKING

  1. Geometric Pose Estimation- 几何姿态估计

是时间t这一帧深度图中第k个顶点在相机坐标系下的空间位置,是建立的地图中相关联的顶点和向量(第t-1步优化完毕得到)。是当前的估计,从前一相机姿态到当前这一姿态的转换估计。则将Lie代数转换到相关的Lie群中,代表的应该是前一帧在世界坐标系的位置。顶点之间用投影数据关联互相关联[引了KinectFusion]。

解析:该公式表达的含义是用深度图像估计相机姿态变换。而优化的误差函数则是非常正常地将新一帧中对应的点(应该是表达在空间坐标系下),按照姿态变换投影到上一帧位置中去,然后计算它们之间在空间的距离。距离计算方式为向法向量作投影。

其中所谓上一帧的位置,实际上应该叫做当前model的位置。即都是与地图相关的量,因而不带下标t。

那么关键问题来了,如何确定点之间的数据关联呢?论文中引用了KinectFusion文章,而具该文所述,数据关联的方式即为…..【此处留疑问,待后面查证。 7/30晚】

 

  1. Photometric Pose Estimation

这个值是从估计的active model部分的。而不是单纯的上一帧,要注意这是一个frame-model模型。则是非常正常的新进来一帧彩色图像。

该方程中后部分I所需要描述的值为,以当前相机姿态去看已经建立好的地图,应该看到的点u所对应的彩色值。

根据前面定义:,一个点的3D反投影,给定坐标点和深度,投影到相机坐标下的三维空间中。T和李群计算,则将其从通过深度取到的深度图坐标系下的空间点转化成,世界坐标系下。而model下的彩色估计图自然也需要基于世界坐标系才能计算得到。

这个pi用来去掉齐次。

 

需要注意以上两个公式(3)和(4)中都省略了3向量到4向量的齐次变换。

 

  1. 联合估计 Joint Optimisation

给定一个权重之后,二者一起优化求解。

本论文求解方式为Gauss-Newton法,用从粗到精的3层金字塔来用。

2018/7/30 22:48

你可能感兴趣的:(语义SLAM论文解析)