《Cross-Based Local Stereo Matching Using Orthogonal》 读后感

本人学渣一枚,最近在研究立体匹配,记录一下最近读的几篇文章的心得一会,一来方便以后查阅,二来加深一下理解,许多内容总觉得能体会,但是描述不出来,说到底还是理解不够透彻……目前实验室就我在搞这个方向,感觉也很头大,很少写博客,有什么表述不清或者理解有误的地方大家提出来一起讨论,也随时欢迎和做这个方向的朋友一起交流交流,。言归正传,前段时间看了一篇09年的文章,标题是《Cross-Based Local Stereo Matching Using Orthogonal》,本文主要有两个部分,一是作者突破传统矩形支持窗口的思维,自适应的构建十字交叉区域进行代价聚合,二是并通过改进积分图加速代价聚合的计算。下面分别进行讨论。

十字交叉的支持窗口构建

十字交叉的支持窗口构建首先要确定上下左右四个臂的臂长。臂长由像素之间的相似性决定,其公式为:

即某一个臂应该满足:沿该方向,臂长尽可能的长,并且包含的所有像素与中心像素差值小于阈值。这样对于任意一个像素点所形成的十字交叉骨架可以用四个臂长的值来描述。下面根据得到的十字骨架来确定完整的聚合区域。

《Cross-Based Local Stereo Matching Using Orthogonal》 读后感_第1张图片

如图,对于点p,其形成的完整的自适应区域可视作多个水平段H(q)沿竖直方向V(p)滑动组合成的区域。作者提到也可以先竖直再水平,其构建的区域不同,但是表现在实验中的结果相差不大。

支持区域确定后,下面我们进行聚合计算。假设p和p'分别是左右两幅图中的对应点,其在各自所在图中形成的完整支持区域U(p)和U'(p')很可能大小形状是不同的。那我们如何来衡量两个点之间的不相似度?文中给出是组合两个局部聚合区域,取二者重叠的区域,并对其进行归一化计算:

其中表示二者重叠的区域,表示重叠区域内像素数。表示通过截断阈值的方式取对应像素的绝对值差,可以理解成自适应区域的TAD。

视差选择采用WTA的方法,即在内选取使得值最小的视差,作为当前点的初始视差。因为我们默认假设颜色相近区域是同一深度下的,所以作者提出用区域投票的方式进行视差优化,即计算一个聚合区域内所有像素点得到的初始视差出现的次数(把他们构成一个更加直观的直方图),出现次数最多的视差值确定为该区域的最终视差。

待续。。。

你可能感兴趣的:(《Cross-Based Local Stereo Matching Using Orthogonal》 读后感)