1、文章特点:VO中包含重投影误差和光度误差两部分,重投影误差就是通过ORB特征点匹配计算;光度误差类似直接法(此处叫图像对齐方法),但有着一些不同:
2、motion分割方法:直接去除动态先验语义像素
3、可参考部分:特征点法+对齐法的vo模式
1、文章特点:
(1)实例分割实现:首先SSD进行目标检测,然后利用非监督分割方法(基于[31]改进)对深度图进行目标分割;然后将分割与检测信息连接起来实现实例分割。
(2)对象map独立维护:对象模型更新的核心是更新置信度(通过新的目标检测的置信度来累计更新);map由两部分组成:所有观测到的点云(保存的是每一关键帧观测到的点云),每个对象对应的所有分割点云(保存着指向pose graph的指针)。这种保存方式可以在位姿更新时更新map。
2、motion分割方法:此处针对静态场景,没有motion分割功能
(1)帧间数据关联方法:对象实例间数据关联用类似ICP方法:选择与当前检测目标点云质心最近的landmrks对象点云,然后对每个当前目标点云与相关联的landmarks点云计算最近邻点,得到欧式距离,如果有50%点云的距离小于阈值,则形成关联,否则创建新的对象。
3、可参考部分:
4、几何分割相关文献:[31] T. T. Pham, M. Eich, I. Reid, and G. Wyeth, “Geometrically consistent plane extraction for dense indoor 3d maps segmentation,” in 2016 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS. IEEE, October 2016. [32] P. F. Felzenszwalb and D. P. Huttenlocher, “Efficient graph-based image segmentation,” International Journal of Computer Vision, vol. 59, no. 2, pp. 167–181, 2004
1、文章特点
2、motion分割方法
(1)motion检测(相机运动补偿后的帧间差异计算):相机运动由RANSAC方法通过单应变换计算相邻图片间的变换(因此需要保证平面场景能占场景中大部分),然后在补偿后的2D图像上对比差异(也可以在3D点云上对比差异,但是深度信息误差不稳定,且计算3D相机变换较慢)。
(2)motion跟踪(基于粒子滤波器的跟踪):在检测阶段,差分图像中的非零像素表示由运动对象引起的运动。图像差分结果中的噪声是不可避免的,尤其是在单应性估计错误的情况下。因此,使用粒子滤波器来增强运动检测。此处的噪声表示不位于移动对象上的非零像素。以上节输出的差分图作为观测,在2D图像空间跟踪(在3D欧式空间跟踪会在深度方向产生大量粒子层,会增加计算量),粒子滤波步骤:
(3)motion分割(基于深度图矢量量化的分割):在分割阶段,由粒子滤波器计算的后验信度作为MAP估计的似然度。采用矢量量化聚类的深度图像进行运动分割。由MAP计算的前景概率最高的簇被视为前景。
其中nt表示在k类中的粒子数,Nt表示总的粒子数
3、可参考部分:二维图像上的运动检测和跟踪
1、文章特点
(1)运动分割的几何模型和其假设:将F帧中跟踪点的观测值表示为{xi}F=1··F。然后,我们随机抽取一对帧中可见的最少数量的p个这样的点,并使用它们来拟合模型的假设。测试的模型包括基本矩阵F、单应性H以及仿射矩阵A。之所以包括仿射矩阵模型,是因为许多现有数据集包含透视性非常弱的序列,因此该简单模型可能在数值上更稳定。对于三种型号F、H和A,p的相应值分别为8、4和3。通过线性算法估计模型参数,并对每种几何模型采样500×F假设。
(2)Affinity Captured as Ordered Residual Kernel(介绍特征点之间的亲和力如何封装到内核中):根据所有几何模型采样的500×F假设,计算剩余特征点的残差(sampson error),残差小于阈值T表示为inliner。特征点间的亲密性由两特征点在所有假设中的共视数量衡量,然而一个特征点在假设中的是否为内点由阈值T决定,而由于不同场景运动范围不同,T往往不好确定。本文使用ORK(有序残差核)来自适应选取阈值。这样就得到了亲和矩阵,一般亲和矩阵需要根据特征点k近邻方法进行稀疏化。
(3)谱聚类进行运动分割:回顾单视图光谱聚类问题,然后将其扩展到多视图聚类
2、参考学习:sampson error等代价函数的原理,及如何用在单应/基础矩阵评价上(参考MVG书)。
1、文章特点:一般里程计实时执行2D关键点的精确匹配。但是,稀疏的2D关键点可能在环境中分布不均匀。如果动态对象具有许多纹理,则动态关键点的数量将超过静态关键点,这可能导致RANSAC回归失败。因此,通常使用额外的IMU传感器数据来补偿此问题。在本文中,我们选择使用深度边来寻找对应关系。深度边包含环境的结构信息。结果表明,基于深度边缘可以估计出准确的视觉里程。深度边缘点是稀疏的,因此可以有效地进行匹配。此外,深度边缘点的数量比2D关键点更平衡。通过使用几何距离和强度距离来匹配帧之间的边缘点。在匹配边缘点的基础上,提出了一种新的静态加权方法来对视觉里程计方法中的动态点进行加权。此外,利用一种有效的环路闭合检测方法,将视觉里程测量方法融合到一个基于位姿图的SLAM系统中,得到了一个适用于动态环境的快速RGB-D SLAM系统。
2、motion分割:本文是通过给深度边缘上的点赋予静态权重,来分割动静的。这个静态权重是在算得当前帧位姿后,计算当前帧上点与变换坐标后的关键帧上对应点的场景流来分配权重的。
1、文章特点:介绍了DOT(动态对象跟踪),这是一种可以添加到现有的 SLAM 系统中的前端,可以显著提高其在高动态环境中的鲁棒性和准确性。DOT 将实例分割和多视图几何图形相结合,为动态对象生成掩码,以使基于刚性场景模型的 SLAM 系统在优化时避开这些图像区域。为了确定哪些对象实际上在移动,DOT 首先对潜在动态对象实例进行分割,然后利用估计的相机运动,通过最小化光度重投影误差来跟踪这些对象。相比于其他方法,这种短期跟踪提高了分割的准确性。其实DOT的作用就是:生成实际的动态掩码、为SLAM提供优化初始值。
2、motion分割:
1、文章特点:
2、motion分割:
(1)目标检测:每个关键帧上进行2D bounding box和分割掩码推断,另外用3Dbounding box检测方法估计目标初始位姿。
(2)数据关联:将每个检测I与地图中最近的对象相关联,根据不同的输入模式采用不同的策略。当激光雷达输入可用时,比较三维边界框和重建对象之间的距离。当仅使用立体或单目图像作为输入时,计算检测和目标之间的匹配特征点数量。如果多个检测与同一对象相关联,保留最近的一个,并拒绝其他检测。未与任何现有对象关联的检测被初始化为新对象,其形状和姿势在之后进行优化。对于立体和单目输入模式,仅当观察到足够多的曲面点时,才会进行重建。当观测到已经重建的目标后,加入新的camera-object边并仅进行位姿优化。这样通过对象级数据关联,新的检测要么被关联到现有地图中的对象中,要么保存为新对象。一个对象检测实例包括:2D bounding box、2D语义掩码、观测到的3D点云深度值和对象初始位姿(I = {B,M, D, Tco,0})
(3)基于先验的目标重建:使用预训练的DeepSDF作为形状先验,将同一个类别的物体形状表示为64维向量。物体的重建可以被转化为对物体形状向量和7D位姿(Sim(3))的联合优化,使得形状和位姿最适合于当前的观测。我们利用SLAM重建的稀疏map 3D点作为观测,最小化表面损失和深度渲染损失函数以优化目标形状编码和目标位姿。已经存在的目标只优化6自由度位姿。
此处的函数G是DeepSDF预测得到的有符号距离函数,如果点与目标表面完全对齐的话,SDF值为0.
其中du就是Ωr上的观测值;du后验是通过可微光线跟踪构建的SDF渲染器得到的Ωr上对应的后验深度,它是优化量(目标位姿和目标形状)的函数,由于此渲染器是可微的,所以du后验可对优化量(目标位姿和形状参数)求导,因而此深度渲染能量可以作为优化项。
(4)联合地图优化:对象作为节点加入因子图进行优化,且与相机的相对位姿作为camera-object edge
3、参考学习:
1、文章特点
2、静态区域提取
3、无监督场景分割(3D点云分割方法):
(1)简述:利用场景的全局结构化信息和物体局部表面凹凸性,本章提出一种无监督的 3D 场景分割算法,与目前典型的无监督分割算法(还有哪些?)的对比实验结果表明,本场景分割算法抗噪声能力强、分割效果好。主要包括三部分:
(2)超体素滤波
点云处理流程中滤波处理作为预处理,是对点云进行下采样,方便之后的面片操作,此处利用超体素聚类方法进行滤波。
(3)寻找基准平面集:用平面拟合方式寻找基准平面
(4)基于空间结构和局部凹凸性的分割: