【Deep Learning】空洞卷积(膨胀卷积)解析

 前言:在阅读SSD网络的时候,看到conv6层中pad=6,且有个参数dilation: 6。在平时没怎么注意到整个参数,今天对其进行记录。

layer {
  name: "fc6"
  type: "Convolution"
  bottom: "pool5"
  top: "fc6"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 1024
    pad: 6
    kernel_size: 3
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
      value: 0.0
    }
    dilation: 6
  }
}

 caffe源码中conv_layer.cpp关于空洞卷积的计算:

const int kernel_extent = dilation_data[i] * (kernel_shape_data[i] - 1) + 1;

caffe源码中caffe.proto关于dilation的定义:

  // Factor used to dilate the kernel, (implicitly) zero-filling the resulting
  // holes. (Kernel dilation is sometimes referred to by its use in the
  // algorithme à trous from Holschneider et al. 1987.)
  repeated uint32 dilation = 18; // The dilation; defaults to 1

下面以卷积核3*3为例,膨胀系数为2,那么卷积核膨胀之后,卷积核的单边尺寸就变成了2*(3-1)+1,即卷积核的尺寸变成了5*5。

 

              【Deep Learning】空洞卷积(膨胀卷积)解析_第1张图片

 卷积核膨胀是将卷积核扩张到膨胀尺度约束的尺度中,并将原卷积核没有占用的区域填充零

上图中,卷积核由3*3膨胀到了5*5,从图中可以看到,膨胀后的卷积核中空洞的部分填充了一些0,在caffe源码中具体的膨胀操作是在img2col中实现。

1)下面分析一下膨胀系数卷积核膨胀的关系,首先回顾卷积核膨胀公式:

               膨胀后卷积核尺寸 = 膨胀系数 * (原始卷积核尺寸 - 1) + 1

2)卷积核的膨胀系数等于卷积核高和宽方向的扩张倍数,将上式中1移到等式左侧:

               膨胀的卷积核尺寸 - 1 = 膨胀系数 * (原始卷积核尺寸 - 1)

3)原始卷积核在膨胀后,元素间的空洞间隔与膨胀系数的关系:

               元素间隔 = 膨胀系数 - 1

例如:上图中膨胀系数为2,那么膨胀后卷积核元素间的空洞间隔为2-1=1.

空洞卷积的作用:

①:使输出变得更稠密。

②:在不增加计算量的情况下,扩大了卷积核视野(卷积核尺寸变大)。
 

 

你可能感兴趣的:(Deep,Learning)