综述

从二维图像中恢复场景的三维结构是计算机视觉领域一个重要的研究内容,具有数据易获取、成本低廉、普适性好等优点,在教育、医疗、娱乐、公共安全等领域有着广泛的应用。

增量式运动恢复结构(Structure from Motion,SfM)方法是对无序图像集合进行三维重建的重要手段,它包括图像特征点匹配和三维结构恢复两个关键问题。其中,图像特征点匹配是三维结构恢复的基础。

然而,图像之间存在的旋转,光照,视点差异以及重复纹理等,会对匹配的精确度及正确匹配个数造成影响,进而影响重建的效果。三维结构恢复是根据匹配结果计算相机姿态以及三维点坐标的过程。

但是由于无序图像具有数量多、重叠关系未知、分布不均匀等特点,给现有重建系统带来了新的挑战。本文针对无序图像三维重建的问题,分别就如何在保证特征匹配精度的同时提高匹配数量,以及如何在保证重建精度的情况下提高重建效率两个方面展开了研究。

首先,本文提出了基于非均匀高斯混合模型(NGMM)的图像特征匹配算法。该方法将两幅图像上的特征点集分别看做高斯混合模型的中心和数据点,并求解一个具有结构保持特性的空间变换函数使得数据点在该高斯混合模型下的后验概率最大。在构建高斯混合模型时,NGMM根据点集之间的特征相似性赋予高斯混合模型不同的权重系数,得到一个融合了局部特征相似性约束和全局空间结构一致性约束的统一框架。一方面,局部特征信息被用来引导点集之间空间变换函数的计算;另一方面,全局结构信息可以避免匹配陷入局部最优解。所提出的算法不仅削弱了图像特征歧义性带来的影响,也使得匹配算法对于图像之间的噪声、旋转和形变具有更强的鲁棒性,可以在保证匹配精度的同时提高正确匹配的数量。

其次,针对现有准稠密匹配扩展算法所使用的离散二维视差梯度模型和局部仿射变换模型在处理图像的旋转,表面非光滑场景时所面临的问题,本文提出了一种新的一致性子空间模型来计算两幅图像之间的准稠密匹配。首先,在一对种子匹配周围的扩展窗口中给每一个像素计算图像特征,然后通过子空间映射将这些像素的特征信息和坐标信息进行融合,得到点集新的坐标。接下来,在所求的子空间中采用一致性非刚体变换来寻求两个点集之间的匹配。该模型对扩展窗口之间的几何差异更加鲁棒,不依赖于场景表面可用平面近似的假设,因此可以处理更加复杂的场景。此外,本文还提出一种抢占式的匹配策略,在迭代过程中让先得到的匹配引导其他匹配的寻找,进一步提高匹配的可靠性和速度。

最后,提出了一种基于多起点选择和数据划分的运动恢复结构方法,实现从图像中快速、精确地提取场景三维结构。首先,采用分层图的策略从图像分布稠密的地方选择若干个核,并在每个核中确定一幅起点图像。每个核由一组重叠程度较大的,互相连通的图像构成,用于重建场景的基模型。提出了最优重建路径的概念,将所有非核图像按照它们到这些起点图像的最优重建路径划分成多个图像聚类。每个图像聚类中的非核图像成为叶子图像,它们被进一步划分成若干个大小均衡的叶子图像聚类。每个叶子图像聚类将被独立,并行地添加到所对应的基模型中进行重建。本文的起点选择方法能够保证重建从图像稠密的地方向图像稀疏的地方进行,避免了通过重叠较弱的图像传递三维结构导致的累积误差。本文提出的数据划分方法考虑了起点图像,重建路径等因素,与重建的关联性更强。由于所有的核和叶子图像聚类都能并行处理,该方法具有显著的加速效果。

关键词:图像匹配;三维重建;非均匀高斯混合模型;一致性子空间;准稠密扩展;运动恢复结构

你可能感兴趣的:(综述)