2016 IEEE SPL 目前在middlebury上排名第二

  • 提出一种新的CNN 模式,通过一个较大尺寸窗口来学习一个matching cost 与以往的池化层不同(with strides),the proposed per-pixel pyramid-pooling layer can cover a larger area without a loss of resolution and detail.因此cost的学习函数可以利用更大区域的信息,避免引入fattening effect.
  • 创新点: 类似于SPP, 加入multi-scale 的pool,然后对信息进行融合,得到的feature map 不会丢失细节信息。
  • 相比于mc-cnn的改进之处,加入4P模型后,在弱纹理区域,包含了更大的窗口。

1 Introduction

解决window-based在视差不连续区域的不可靠性:One method to handle this trade-off is to make the window-based versatile to its input patterns [10], [11], [12]. making the shape of the matching template adaptive so that it can discard the information from the pixels that are irrelevant to the target pixel.
但是knowing the background pixels before the actual matching is difficult.
existing method are based on AlexNet 或者VGG ,这些都是为识别设计的而不是为匹配设计的。 这类CNN的困难在于增大patches的size
而patch的有效size又直接与感知野的空间区域联系, 并可以通过以下方式扩大:
1) include a few strided pooling /convolution layers
然而,使用strided pooling 或者卷积层会让结果降采样,丢失一些细节信息。Although the resolution can be recovered by applying fractional-strided convolution [17], reconstructing small or thin structures is still difficult if once they are lost after downsampling.

2 related work

关于matching cost的学习 [13,14,22]
[13] mc-cnn :11*11 window,没有使用池化,得到的cost比较noisy,,因此后面使用了CROSS-based cost ggregation+SGM
[14] learning to compare patches.. 采用了multiple pooling layers and spatial-pyramid-pooling (SPP) [24] to process larger patches.
但结果会引入fattening effect,这是由于pooling的信息丢失导致的。
类似的尝试在语义分割中已经有所体现:[25,26,27] 这些方法都是将高层和底层的信息进行结合,使得object-level的信息能够精确到pixel-level
FlowNet [28] 可以将low-level的flow上采样到原始尺寸。
与本文最接近的工作是【24】 (何恺明的SPP)

3 method

输入: 两个patches
输出: matching cost

A. Per-pixel Pyramid Pooling (4P)


进行多个不同窗口尺寸的池化,并将输出连接得到新的feature maps
注意,这个multi-scale pooling operation 是对每个像素进行,而stride =1! 

立体匹配CNN篇(一) :[LW-CNN] look wider to match image patches by cnn_第1张图片

B. proposed model

立体匹配CNN篇(一) :[LW-CNN] look wider to match image patches by cnn_第2张图片

4 实验

1)patch size: 3737
2)只fine-tune 最后面三个11卷积层,这比随机初始化的效果好,
3) lr : 0.003->0.0003

5 未解决



