计算机视觉——NCC视差匹配

目录

  • 一、实验原理
  • 二、匹配流程
  • 三、代码实现
  • 四、结果分析
    • 第一组数据
    • 第二组数据

一、实验原理

NCC,顾名思义,就是用于归一化待匹配目标之间的相关程度,注意这里比较的是原始像素。通过在待匹配像素位置p(px,py)构建3*3邻域匹配窗口,与目标像素位置p’(px+d,py)同样构建邻域匹配窗口的方式建立目标函数来对匹配窗口进行度量相关性,注意这里构建相关窗口的前提是两帧图像之间已经校正到水平位置,即光心处于同一水平线上,此时极线是水平的,否则匹配过程只能在倾斜的极线方向上完成,这将消耗更多的计算资源。相关程度的度量方式由如下式子定义:
计算机视觉——NCC视差匹配_第1张图片
上式中的变量需要解释一下:其中p点表示图像I1待匹配像素坐标(px,py),d表示在图像I2被查询像素位置在水平方向上与px的距离。如下图所示: 
计算机视觉——NCC视差匹配_第2张图片
左边为图像I1,右边为图像I2。图像I1,蓝色方框表示待匹配像素坐标(px,py),图像I2蓝色方框表示坐标位置为(px,py),红色方框表示坐标位置(px+d,py)。(由于画图水平有限,只能文字和图片双重说明来完成了~)

Wp表示以待匹配像素坐标为中心的匹配窗口,通常为3*3匹配窗口。

没有上划线的I1表示匹配窗口中某个像素位置的像素值,带上划线的I1表示匹配窗口所有像素的均值。I2同理。

上述公式表示度量两个匹配窗口之间的相关性,通过归一化将匹配结果限制在 [-1,1]的范围内,可以非常方便得到判断匹配窗口相关程度:

若NCC = -1,则表示两个匹配窗口完全不相关,相反,若NCC = 1时,表示两个匹配窗口相关程度非常高。

二、匹配流程

  1. 采集图像:通过标定好的双目相机采集图像,当然也可以用两个单目相机来组合成双目相机。
  2. 极线校正:校正的目的是使两帧图像极线处于水平方向,或者说是使两帧图像的光心处于同一水平线上。通过校正极线可以方便后续的NCC 操作。
  • 由标定得到的内参中畸变信息中可以对图像去除畸变。
  • 通过校正函数校正以后得到相机的矫正变换R和新的投影矩阵P,接下来是要对左右视图进行去畸变,并得到重映射矩阵。
  1. 特征匹配:这里便是我们利用NCC做匹配的步骤啦,匹配方法如上所述,右视图中与左视图待测像素同一水平线上相关性最高的即为最优匹配。完成匹配后,我们需要记录其视差d,即待测像素水平方向xl与匹配像素水平方向xr之间的差值d=xr−xl ,最终我们可以得到一个与原始图像尺寸相同的视差图D 。
  2. 深度恢复:通过上述匹配结果得到的视差图D,我们可以很简单的利用相似三角形反推出以左视图为参考系的深度图。计算原理如下图所示:
    计算机视觉——NCC视差匹配_第3张图片

如图,Tx为双目相机基线,f为相机焦距,这些可以通过相机标定步骤得到。而xr−xl就是视差d 。

通过公式在这里插入图片描述
可以很简单地得到以左视图为参考系的深度图了。至此,我们便完成了双目立体匹配。

三、代码实现

# -*- coding: utf-8 -*-
from PIL import Image
from pylab import *
from numpy import *
from numpy.ma import array
from scipy.ndimage import filters
def plane_sweep_ncc(im_l,im_r,start,steps,wid):
    
    m,n = im_l.shape
    # 保存不同求和值的数组
    mean_l = zeros((m,n))
    mean_r = zeros((m,n))
    s = zeros((m,n))
    s_l = zeros((m,n))
    s_r = zeros((m,n))
    # 保存深度平面的数组
    dmaps = zeros((m,n,steps))
    # 计算图像块的平均值
    filters.uniform_filter(im_l,wid,mean_l)
    filters.uniform_filter(im_r,wid,mean_r)
    # 归一化图像
    norm_l = im_l - mean_l
    norm_r = im_r - mean_r
    # 尝试不同的视差
    for displ in range(steps):
        # 将左边图像移动到右边,计算加和
        filters.uniform_filter(np.roll(norm_l, -displ - start) * norm_r, wid, s) # 和归一化
        filters.uniform_filter(np.roll(norm_l, -displ - start) * np.roll(norm_l, -displ - start), wid, s_l)
        filters.uniform_filter(norm_r*norm_r,wid,s_r) # 和反归一化
        # 保存 ncc 的分数
        dmaps[:,:,displ] = s / sqrt(s_l * s_r)
        # 为每个像素选取最佳深度
    return np.argmax(dmaps, axis=2)

def plane_sweep_gauss(im_l,im_r,start,steps,wid):
 """ 使用带有高斯加权周边的归一化互相关计算视差图像 """
 m,n = im_l.shape
 # 保存不同加和的数组
 mean_l = zeros((m,n))
 mean_r = zeros((m,n))
 s = zeros((m,n))
 s_l = zeros((m,n))
 s_r = zeros((m,n))
 # 保存深度平面的数组
 dmaps = zeros((m,n,steps))
 # 计算平均值
 filters.gaussian_filter(im_l,wid,0,mean_l)
 filters.gaussian_filter(im_r,wid,0,mean_r)
 # 归一化图像
 norm_l = im_l - mean_l
 norm_r = im_r - mean_r
 # 尝试不同的视差
 for displ in range(steps):
     # 将左边图像移动到右边,计算加和
     filters.gaussian_filter(np.roll(norm_l, -displ - start) * norm_r, wid, 0, s) # 和归一化
     filters.gaussian_filter(np.roll(norm_l, -displ - start) * np.roll(norm_l, -displ - start), wid, 0, s_l)
     filters.gaussian_filter(norm_r*norm_r,wid,0,s_r) # 和反归一化
     # 保存 ncc 的分数
     dmaps[:,:,displ] = s / np.sqrt(s_l * s_r)
 # 为每个像素选取最佳深度
 return np.argmax(dmaps, axis=2)

im_l = array(Image.open(r'scene1.row3.col3.ppm').convert('L'), 'f')
im_r = array(Image.open(r'scene1.row3.col4.ppm').convert('L'),'f')
# 开始偏移,并设置步长
steps = 12
start = 4
# ncc 的宽度
wid = 9
res = plane_sweep_ncc(im_l,im_r,start,steps,wid)
import scipy.misc
scipy.misc.imsave('depth.png',res)
show()

四、结果分析

在书本给出的网址中下载了两组数据集

第一组数据

采用的数据集:
计算机视觉——NCC视差匹配_第4张图片

计算机视觉——NCC视差匹配_第5张图片

当窗口值为9时
计算机视觉——NCC视差匹配_第6张图片
当窗口值为7时:]
计算机视觉——NCC视差匹配_第7张图片

当窗口值为5时:
计算机视觉——NCC视差匹配_第8张图片

当窗口值为3时:
计算机视觉——NCC视差匹配_第9张图片

当窗口值为11时:
计算机视觉——NCC视差匹配_第10张图片

当窗口值为15时:
计算机视觉——NCC视差匹配_第11张图片

第二组数据

采用的数据集:
计算机视觉——NCC视差匹配_第12张图片
计算机视觉——NCC视差匹配_第13张图片

当窗口值为9时:
计算机视觉——NCC视差匹配_第14张图片

当窗口值为7时:
计算机视觉——NCC视差匹配_第15张图片

当窗口值为5时:
计算机视觉——NCC视差匹配_第16张图片

当窗口值为11时:
计算机视觉——NCC视差匹配_第17张图片

当窗口值为13时:
计算机视觉——NCC视差匹配_第18张图片
结果分析:

  1. 通过对不同窗口值所测试出的结果可以发现,当窗口值过小时,匹配代价区分度过低,在低纹理区域容易出现误匹配,匹配精度较低;
  2. 随着窗口值增大,匹配区分度逐渐清晰,误匹配区域得到矫正,匹配精度随着窗口值增大而变高。
  3. 但当窗口值过大时,在深度区域容易出现误匹配。因此窗口值的大小应适中,不能太大也不能太小。

你可能感兴趣的:(计算机视觉——NCC视差匹配)