以下是这篇文章的主要内容
1.这篇文章,首先,调研了目前多视觉立体算法,用一个区别于他们关键属性的分类方法对他们进行比较。然后,描述我们获取高精度真实背景多视觉立体图片数据集和对其进行标定的过程。最后,我们给出对多视觉立体重建算法的比较结果。
2.多视觉立体分类法
(1)场景描述(Scene representation)
物体或场景的几何可以有多种描述方式:像素,水平集,多边形网格,深度图。
3D网格:简单,一致(uniformity),可以近似任何表面
多边形网格:高效存储和补偿,流行于多视觉算法的输出格式,适合可视化计算,作为中心描述
深度图:避免3D领域几何重采样,对更小的数据集2D描述方便
(2)图像一致性测量(Photo-consistency measure)
对一个图像中的像素点和另一个图像中的像素点进行比较,观察他们的相关性,称为图像一致性测量。基于这些测量时定义在场景空间(scene space)还是图像空间(image space)我们对其加以分类。
场景空间(scene space):选定输入图象的一个点,一个路径或一块体积,将它们加入工程中,在不同的工程中比较它们的融合度。一个简单的融合度测量就是测量输入图象工程中的像素点的变化。
图像空间(image space):运用几何场景的估计,从一个视点预测不同的视点,比较预测图片区域和已测量图象区域,此时图象一致性测量被称为预测误差。
(3)可视化模型(Visibility model)
可视化模型指定说明当我们评价图象一致性测量时哪张视图予以考虑。因为场景可视化会随着视点的不同动态的改变,几乎所有现在的多视觉立体算法在某种方式上都可以描述为封闭的。处理可视化的方法包括几何学,半几何学和基于孤立点的方法。
几何学方法:寻找明确地模型图象格式处理和场景形状来决定哪个图象中的哪个场景结构是可视的。
半几何学方法:使用近似几何学的,因为它要推断可视化关系。
基于孤立点方法:避免明确几何模型,将封闭视为孤立点。尤其当场景中可视的点比它们被闭塞的点多时,简单的孤立点丢弃技术可以被运用选取一个好的视图。
(4)先验形状(Shape prior)
单单图象一致性测量不足以发现精确的几何体,特别在低纹理的场景区域。然而,先验在双目立体中是必须的,但在从多个视图中约束很强的多视觉立体中重要性不大。
(5)重建算法(Reconstruction algorithm)
分为四类:
第一类:首先计算3D体积的花费函数(cost function)(估价函数),然后从这个体积中提取表面。
第二类:首先迭代演化表面以减少或最小化估价函数。
第三类:基于图象方法即计算一系列深度图。
第四类:首先提取和匹配特征点,然后配合重建特征的表面。
(6)初始化要求(Initialization requirement)
已标定图象,输入关于重建物体或场景的几何范围信息,提供约束条件
3.多视觉数据集
4.评价方法
(1)计算完整点的精度
如图(a)和(b)
(2)计算不完整点的精度
如图(c)
5.结果
(1)六个人的算法描述
(2)评价参数:完整点:90%的点在GTM模型中术语1mm范围内
不完整点:95%的点在GTM模型中术语1.25mm范围内
精确度上:Hernandez最好
运行速度上:Pons的最快,Goesele最慢