灭点检测算法综述


灭点检测在三维重建、计算机视觉有着重要的应用;主要的应用是根据单幅图像能够获取相机的内参数,适应的大多数场景为曼哈顿结构。

最近参考了2013年CVPR的一篇文章《Globally Optimal Line Clustering and Vanishing Point Estimation in ManhattanWorld》,没有对于该文章的算法进行算法测试。不过目前业界公认的最好的灭点检测算法为J-Linkage,J-linkage灭点检测算法最初被R Toldo,A Fusiello在2008年的一篇ECCV文章:Robust Multiple Structures Estimation with J-Linkage提出,2009年被加拿大麦吉尔大学Jean-Philippe Tardif推广到灭点检测算法上:《Non-iterative approach for fast and accurate vanishing point detection》,在其主页上能够下载到J-Linkage源码,但环境配置略微复杂。

调研了很多灭点检测的算法,写一个综述。

灭点检测算法综述

       以2013年的《Globally Optimal Line Clustering and Vanishing Point Estimation in ManhattanWorld》为例对于灭点检测算法进行一个综述。灭点检测算法实质即为聚类算法,直线段能够检测出,直线的交点亦能够检测出,若已知灭点的位置,则直线的分类能够计算出,若已知直线的分类,则灭点的位置亦能够计算出,这是一个先有鸡还是先有蛋的问题。


现有的灭点检测算法可分为四类。

第一类即为通过霍夫变换来进行灭点的检测,对于每一个可能的直线对,这对直线交点的方向能够被计算出来,并且他们的角度能够积累到一个参量中。通过选择包含最高数量词目的参量来获得占据主导的灭点。然而,这种方法对于角度参量量化的水平十分的敏感,可能导致多重的检测。除此之外,由于灭点是各自独立检测,所以这种方法并不能够直接在灭点上强加正交性的约束。高斯球灭点检测算法的思想与该算法类似,即把图像中的直线映射到高斯球上,在高斯球上划分累加单元,求取交点数目最多的累加单元对应的球坐标,再映射到原图像中即为灭点的位置。


第二类即为通过RANSAC的方法对灭点进行检测。具体的过程是:随机的选择两条直线来创建一个假设的灭点,之后再计算通过这个假设灭点的直线的数量。经过一定数量的迭代之后,返回值是一个能够最大化相交直线数量的灭点(同时返回相关联的直线簇)。J-Linkage是对于RANSAC多模型的扩展。RANSAC以及它的延伸算法(multi-RANSAN,J-linkage等等)的一个重要的理论限制是不能够保证它们解的最优化(就最大化直线的数量来说)。并且结果不是唯一的,即对于同一组数据两次运行的结果可能不一样。《Consensus set maximization with guaranteed global optimality for robust geometry estimation》提出一种能够克服这些限制的方法,但是这种方法受限于有着线性距离函数的线性问题。《Optimal estimation of vanishing points in a manhattanworld》提出了一种多项式逼近来使得灭点正交的方法,然而这只能够考虑到代数的损失。


第三种涉及到对于未知实体进行穷举搜索的过程。例如《Rotation estimation and vanishing point extraction by omnidirec-tional vision in urban environment》中展示了一种对于旋转空间采样来确定最为一致的旋转,这是一种能够最大化直线簇的方法。这种方法能够很好的对直线进行分类并且能够很好地使得灭点正交。然而这取决于采样的间隔以及初始值。而且即使采样取得很好也并不能够保证得到最佳值。


第四种则直接面对先有鸡还是先有蛋的问题,这种方法也基本上遵循EM方法。即它交替在给定一个已经存在的或者假设的灭点,来进行直线分类的期望(E)步骤,与通过E步骤给定的数据集,来计算灭点这样一个最大化的步骤(M)。这样迭代计算直至收敛即可。然而这种方法高度依赖初始情况以及可能汇聚到局部最小值这种情况。EM算法在灭点检测领域有三篇文章供参考,最早的问CVPR2000的一篇《Automatic Recovery of Relative Camera Rotations for Urban Scenes》,该文章中对于EM算法讲述的十分详细,并且利用霍夫变换的方法进行初始化;另外一篇为Video Compass2002年的《Video Compass》,该文章中对于EM迭代算法讲述的较为简略;还有一篇《Efficient Edge-Based Methods for Estimating Manhattan Frames in Urban Imagery》,文章浏览了一下,内容涉及EM算法进行求解最优值的问题。



你可能感兴趣的:(图像处理)