LOAM框架包含三个步骤:
Scan registration:从原始激光扫描点数据中提取点特征。点特征是角点或者面点。
odometry estimation:在特征提取之后,特征点传递到里程计模块,通过特征匹配和优化步骤计算相对坐标变换即当前帧激光扫描数据相对前一帧激光扫描数据的位姿。里程计模块输出一个6-DoF位姿估计,作为建图模块的初始位姿估计。
mapping:
建图模块的第一步是地图准备,将地图的特征点排序并存储在一个立方体结构中,用于查找当前扫描点的特征与地图特征的对应关系。
J ( q , t ) = ∑ c S ∈ C S ρ ( ∥ f S ( c S , q , t ) ∥ 2 ) + ∑ c C ∈ C C ρ ( ∥ f C ( c C , q , t ) ∥ 2 ) J(q,t)=\sum_{c^{\mathcal{S}}\in C^{\mathcal{S}}}\rho(\Vert f^{\mathcal{S}}(c^{\mathcal{S}},q,t) \Vert^2)+\sum_{c^{\mathcal{C}}\in C^{\mathcal{C}}}\rho(\Vert f^{\mathcal{C}}(c^{\mathcal{C}},q,t) \Vert^2) J(q,t)=cS∈CS∑ρ(∥fS(cS,q,t)∥2)+cC∈CC∑ρ(∥fC(cC,q,t)∥2)
C C = { c 1 C , c 2 C , ⋯ , c n C } C^{\mathcal{C}}=\{c_1^{\mathcal{C}},c_2^{\mathcal{C}},\cdots,c_n^{\mathcal{C}}\} CC={c1C,c2C,⋯,cnC}是角点特征的特征点对应关系, C S = { c 1 S , c 2 S , ⋯ , c m S } C^{\mathcal{S}}=\{c_1^{\mathcal{S}},c_2^{\mathcal{S}},\cdots,c_m^{\mathcal{S}}\} CS={c1S,c2S,⋯,cmS}是面特征的特征点对应关系,特征点对应关系的格式为 c = { p 1 , p 2 } c=\{p_1,p_2\} c={p1,p2},其中 p 1 p_1 p1是当前帧雷达扫描的点, p 2 p_2 p2是地图的点。 q , t q,t q,t是雷达坐标系转换到地图坐标系的四元数和平移向量。通过优化得到最优坐标变换,再次迭代执行特征点匹配和位姿优化。在两次迭代之后,使用最终的最优坐标变换将当前帧雷达扫描点的特征点插入到地图中。随后,更新后的地图可用于估计下一帧激光扫描的6-DoF位姿。
利用环境中的参考物体等先验知识来改善定位精度,减少漂移,提升地图构建质量,但之前的大多数工作都是利用二维CAD平面图等二维先验信息,即使使用三维模型,对3D先验信息的处理也很粗糙,例如对3D CAD建筑图采样得到初始点云地图进行定位,没有用3D先验信息优化建图的算法。该算法率先提出利用3D参考对象进行轨迹和地图优化,并提出了一种使用具体使用3D三角网格模型的方法。
该算法假设已知参考对象的3D模型及其在全局坐标系的位置,而且该算法对于参考模型的模型精度和位置精度要求很高,建模误差和模型位置误差都会导致算法性能的下降,甚至造成反向提升的效果。
该算法只针对激光雷达,应用范围受限,也不可避免的继承了激光SLAM的固有缺陷。
能否扩展到视觉传感器?
能否不知道参考对象的全局位姿,只知道参考对象的几何信息?
能否利用除几何信息外的先验信息?例如,桌子的四个腿成矩形排列,桌子上面有个碗。
先验信息能否来自AI检测或分割算法?
能否利用更高级、更抽象的先验信息帮助定位建图?
拓展了主流激光定位LOAM算法框架,在后端优化中不只利用激光特征点信息,还利用从参考物体的3D mesh模型中提取的网格特征,网格特征是在参考对象mesh模型表面上采样的虚拟点(mesh模型表面距离当前激光扫描点最近的点)。point-to-mesh匹配特征的欧式距离平方和作为新的代价函数加入LOAM的常规地图优化步骤。
使用了Axis-Aligned-Bounding-Box-Tree(AABB Tree)数据结构来加速网格特征匹配,能够处理由数十万三角网格组成的3D mesh模型。不止利用已经提前构建好的地图来做全局定位,还考虑与参考物体的相对位置减少长期漂移。
首先假设参考对象的模型及其在全局坐标系下的位姿是已知的,模型以3D三角网格的形式给出。
AABB-Tree 每个叶节点都包含网格的一个面。
1) 点云分离 Scan-Isolation
使用odometry模块的输出作为initial pose将原始点云数据从雷达坐标系转换到地图坐标系。
分离点云
从原始点云数据中分离出属于参考对象的雷达扫描点。具体方法为只保留一个比参考对象3D模型大一点的3D bounding box之内的点云。理想情况下,只有属于参考对象的雷达扫描点会被保留下来。
需要权衡裁剪点云的方法,如果裁剪条件太严格,则必须要很准确的雷达初始位姿估计,否则可能剔除很多参考对象的扫描点,导致优化结果效果不好。而如果裁剪条件太宽松,则可能保留很多不属于参考对象的扫描点,导致反向优化使结果更差。
2) 网格特征提取 Mesh Feature Extraction(包含scan-to-model Alignment)
3D triangular mesh 模型是由一个个三角形面组成,每一个三角面由其顶点隐式定义。
3) 联合优化
f M ( c M , q , t ) = ( q p 1 q − 1 + t ) − p 2 , w i t h p 1 , p 2 ∈ c M f^{\mathcal{M}}(c^{\mathcal{M}},q,t)=(qp_1q^{-1}+t)-p_2 ,{\rm{with}\ } p_1,p_2\in c^{\mathcal{M}} fM(cM,q,t)=(qp1q−1+t)−p2,with p1,p2∈cM
J ( q , t ) = 1 C S ˉ ˉ ∑ c S ∈ C S ρ ( ∥ f S ( c S , q , t ) ∥ 2 ) + 1 C C ˉ ˉ ∑ c C ∈ C C ρ ( ∥ f C ( c C , q , t ) ∥ 2 ) + λ C M ˉ ˉ ∑ c M ∈ C M ρ ( ∥ f M ( c M , q , t ) ∥ 2 ) J(q,t)=\dfrac{1}{\bar{\bar{C^{\mathcal{S}}}}}\sum_{c^{\mathcal{S}}\in C^{\mathcal{S}}}\rho(\Vert f^{\mathcal{S}}(c^{\mathcal{S}},q,t) \Vert^2)+\dfrac{1}{\bar{\bar{C^{\mathcal{C}}}}}\sum_{c^{\mathcal{C}}\in C^{\mathcal{C}}}\rho(\Vert f^{\mathcal{C}}(c^{\mathcal{C}},q,t) \Vert^2) +\dfrac{\lambda}{\bar{\bar{C^{\mathcal{M}}}}}\sum_{c^{\mathcal{M}}\in C^{\mathcal{M}}} \rho(\Vert f^{\mathcal{M}}(c^{\mathcal{M}},q,t) \Vert^2) J(q,t)=CSˉˉ1cS∈CS∑ρ(∥fS(cS,q,t)∥2)+CCˉˉ1cC∈CC∑ρ(∥fC(cC,q,t)∥2)+CMˉˉλcM∈CM∑ρ(∥fM(cM,q,t)∥2)
C S ˉ ˉ , C C ˉ ˉ , C M ˉ ˉ \bar{\bar{C^{\mathcal{S}}}},\bar{\bar{C^{\mathcal{C}}}},\bar{\bar{C^{\mathcal{M}}}} CSˉˉ,CCˉˉ,CMˉˉ是对应关系集合的元素数; λ \lambda λ是加权乘子,调整point-to-mesh残差的影响。
就像 LOAM 一样,在得出最终优化的 6-DoF 姿势之前,我们至少运行了两次对应估计和联合优化迭代。直观地说,联合优化问题最小化了扫描点和地图点之间的残差,同时也最小化了孤立扫描点对网格表面的残差。这有效地将扫描与网格表面对齐,在当前环境中提供绝对参考并减少长期漂移,同时还考虑了构建的地图。地图构建过程与LOAM相同。
与LOAM算法的对比,在三个场景中 APE中位值分别降低了超过92%,69%,94%。
而随着迭代次数的增加,R-LOAM的提升更明显。
网格特征是对点特征的重要补充。在某些数据集上,由于点特征很稀疏,LOAM可能无法运行成功,而由于R-LOAM利用了3D参考模型补充了mesh feature可以成功跑通。
RPE(relative pose error)相对位姿误差
APE(Absolute Pose Error)绝对位姿误差
APE 首先将真实值和估计值进行对齐,然后计算每个真实值和估计值之间的偏差得到,适合评估整条轨迹的全局一致性。
RMSE(Root Mean Square Error)均方根误差
STD(Standard Deviation)标准差
RE(Rotational Error)旋转误差
R-LOAM没有对于扫描-模型误匹配的处理机制,一旦使用误匹配的扫描-模型误差项优化,会极大影响定位和建图的效果。R-LOAM中的利用先验信息的优化与LOAM中的map optimization紧耦合,这限制了算法在线运行下的地图优化迭代次数。
扫描点云分离 Scan-Isolation
点云分离阶段,与R-LOAM相同,目的是保留只属于参考对象的扫描点。
扫描点到模型的匹配 Scan-to-Model Alignment
扫描点-模型匹配阶段的目的是精细化LOAM的输出map-optimized poses。这是通过匹配分离后的点云与参考模型来实现的,然而,扫描点与参考模型的匹配质量对于优化效果影响很大,错误的匹配会增大位姿误差。为此,RO-LOAM改进了R-LOAM的匹配方式,使用一系列连续的时序数据而不是只是某一时刻的数据去评估点云-模型匹配的准确性。
在接收到L次分离雷达扫描点后,如果最近的M+1次分离扫描点云都超过50个点,则执行分离扫描点与模型的配准操作。之后的分离扫描点云和对应的校正位姿会被缓存直到这个条件被满足。M+1帧从时间t-M到t采集的被分离的扫描点 P D t − M : t \mathcal{P}^{D_{t-M:t}} PDt−M:t与模型的匹配可以多线程执行。参数L控制TMO的频率;参数M控制了下一阶段候选者评估的序列长度,M过小将导致EKF的输入序列过短,达不到收敛,M过大更可能导致由于状态转移函数的偏差而收敛到错误值,这两种情况下,执行TMO的次数都会减少。
在匹配之前,会统一执行一次降采样将分离点云的数量限制在500以限制计算复杂度。使用距离阈值来去除外点提高鲁棒性。匹配方法为ICP迭代最近点,执行100次匹配估计和优化迭代以收敛到极小的位姿误差。
该模块的输出是与模型配准后的位姿 W T ~ D t − M : t ^W\tilde{T}_{D_{t-M:t}} WT~Dt−M:t 。
候选者评估 Candidate Evaluation
接收上一模块的 W T ~ D t − M : t ^W\tilde{T}_{D_{t-M:t}} WT~Dt−M:t 输出,并评估扫描-模型匹配的精度是否达标,如果达标则将 W T ~ D t ^W\tilde{T}_{D_t} WT~Dt输出到下一模型。
W T ~ D t − M : t − 1 ^W\tilde{T}_{D_{t-M:t-1}} WT~Dt−M:t−1作为观测输入 z K z_K zK,对于每个观测,EKF执行一次预测步和一次校正步,最终通过一步预测得到预测状态 x K ∣ K − 1 x_{K|K-1} xK∣K−1作为最后一个模型配准位姿 W T ~ D t ^W\tilde{T}_{D_t} WT~Dt 的运动先验 W T ^ D t ^W\hat{T}_{D_t} WT^Dt。
如果 W T ^ D t ^W\hat{T}_{D_t} WT^Dt与 W T ~ D t ^W\tilde{T}_{D_t} WT~Dt的平移误差和旋转误差均小于阈值,则说明扫描与模型配准的精度足够高,将 W T ~ D t ^W\tilde{T}_{D_t} WT~Dt输出到下一个模块优化轨迹。
位姿图优化 Pose Graph Optimization (PGO)
PGO校正自上次TMO以来的轨迹,使用校正后的位姿可以用来更新地图。
在接收到模型配准位姿 W T ~ D t ^W\tilde{T}_{D_t} WT~Dt之后,从LiDAR-SLAM算法的mapping module接收的map-optimized poses W T D t − X : t ^WT_{D_{t-X:t}} WTDt−X:t构建位姿图,前一个TMO在时间 t − X t-X t−X执行,当前TMO在时间 t t t执行。节点由边连接 ε = { e 0 , 1 , e 1 , 2 , ⋯ } \varepsilon=\{e_{0,1},e_{1,2},\cdots\} ε={e0,1,e1,2,⋯},每一条边 e i , j = < Ω i , j , q i , j , t i , j > e_{i,j}=\left<\Omega_{i,j},q_{i,j},t_{i,j}\right> ei,j=⟨Ωi,j,qi,j,ti,j⟩代表一个连接节点 n i n_i ni和 n j n_j nj的图约束, q i , j q_{i,j} qi,j和 t i , j t_{i,j} ti,j描述两个节点之间的相对位姿,由 D i T D j = W T D i − 1 W T D j ^{D_i}T_{D_j}=^WT^{-1}_{D_i}\ ^WT_{D_j} DiTDj=WTDi−1 WTDj得到, Ω i , j \Omega_{i,j} Ωi,j是 6 × 6 6\times 6 6×6的信息矩阵,描述相对位姿的可信程度。
J ( q ^ i , j , t ^ i , j ) = ∑ e ∈ ε ρ ( ∥ f ( e i , j , q ^ i , j , t ^ i , j ) ∥ 2 ) f ( e i , j , q ^ i , j , t ^ i , j ) = Ω ^ i , j [ Δ t i , j 2 Δ q → i , j ] Δ t i , j = t i , j − t ^ i , j Δ q i , j = q i , j q ^ i , j ∗ J(\hat{q}_{i,j},\hat{t}_{i,j})=\sum_{e\in\varepsilon}\rho(\Vert f(e_{i,j},\hat{q}_{i,j},\hat{t}_{i,j}) \Vert^2)\\ f(e_{i,j},\hat{q}_{i,j},\hat{t}_{i,j})=\hat{\Omega}_{i,j}\begin{bmatrix}\Delta t_{i,j}\\ 2\Delta \overrightarrow{q}_{i,j}\end{bmatrix}\\ \Delta t_{i,j}=t_{i,j}-\hat{t}_{i,j}\\ \Delta q_{i,j}=q_{i,j}\hat{q}^*_{i,j} J(q^i,j,t^i,j)=e∈ε∑ρ(∥f(ei,j,q^i,j,t^i,j)∥2)f(ei,j,q^i,j,t^i,j)=Ω^i,j[Δti,j2Δqi,j]Δti,j=ti,j−t^i,jΔqi,j=qi,jq^i,j∗
其中 q ^ i , j , t ^ i , j \hat{q}_{i,j},\hat{t}_{i,j} q^i,j,t^i,j是迭代优化的节点变量, Ω ^ i , j \hat{\Omega}_{i,j} Ω^i,j 是信息矩阵 Ω i , j \Omega_{i,j} Ωi,j经过Cholesky 分解的下三角矩阵。
对于每个相邻节点的相对位姿,取单位信息矩阵 Ω = I \Omega=I Ω=I,在优化过程中每条相对位姿的边是平等的。最后加入上一个TMO位姿与当前TMO位姿的相对位姿边,约束 D t − X T D t = W T ˉ D t − X − 1 W T ~ D t ^{D_{t-X}}T_{D_{t}}=^W\bar{T}^{-1}_{D_{t-X}}\ ^W\tilde{T}_{D_t} Dt−XTDt=WTˉDt−X−1 WT~Dt,并将位姿图的第一个节点 W T D t − X ^WT_{D_{t-X}} WTDt−X,即上一次TMO优化的位姿设置为常数,这样优化器就不会再优化它。设置这条边的信息矩阵为很大的值 Ω t − X , t = 4000 ∗ I \Omega_{t-X,t}=4000*I Ωt−X,t=4000∗I。由于第一个节点是常数,并且对于当前TMO位姿设置了一个很大的信息矩阵,所以只有两个TMO pose之间的位姿节点被优化,输出结果为 W T ˉ D t − X : t ^W\bar{T}_{D_{t-X:t}} WTˉDt−X:t, W T ˉ D t − X = W T ~ D t − X , a n d W T ˉ D t = W T ~ D t ^W\bar{T}_{D_{t-X}}=^W\tilde{T}_{D_{t-X}},and\ ^W\bar{T}_{D_{t}}=^W\tilde{T}_{D_{t}} WTˉDt−X=WT~Dt−X,and WTˉDt=WT~Dt.
地图校正 Map Correction
有了上一阶段的输出PG-optimized poses W T ˉ D t − X : t ^W\bar{T}_{D_{t-X:t}} WTˉDt−X:t,就可以通过重投影之前的雷达扫描点用来校正地图。
地图校正模块是TMO扩展算法与LiDAR-SLAM算法直接的接口,是RO-SLAM中唯一与LiDAR-SLAM算法紧耦合的模块,因为它高度依赖于建图模块的地图结构。
在LOAM和R-LOAM上激活RO扩展程序可以显著减少 LOAM 和 R-LOAM 的 APE,而在车载计算机上几乎没有额外的计算成本。