带有空洞卷积的卷积神经网络的感受野计算方法

每个卷积层可视为三元组[kernel_size, stride, dilation],
每个最大池化层可视为二元组[1, stride]。

以一个类似Deeplabv3+的Resnet50为例。
总共有4个block,每个block的layer个数为:[3, 4, 6, 3]。
以最后一个block的参数为例,有[[3, 1, 1], [3, 1, 2], [3, 1, 4]]。
感受野计算代码如下:

layers = [[7, 2], [1, 2], [3, 1], [3, 1], [3, 1], [3, 2], [3, 1], [3, 1], [3, 1], [3, 2],[3, 1], [3, 1], [3, 1], [3, 1], [3, 1], [3, 1, 1], [3, 1, 2], [3, 1, 4]]
rf_stride = 1
rf = 1
for layer in layers:
    if len(layer) == 2:
        k = layer[0]
        stride = layer[1]
    if len(layer) == 3:
        kernel_size = layer[0]
        stride = layer[1]
        dilation = layer[2]
        k = (dilation-1)*(kernel_size-1)+kernel_size
    rf = rf + rf_stride * (k-1)
    rf_stride *= stride
	print(rf)

其中,rf为当前层的每个神经元的感受野大小,k为真实的卷积核大小(与dilation系数有关),rf_stride为当前层的感受野步长,其为前馈网络父节点所有stride的连乘。则由rf = rf + rf_stride * (k-1)可计算出当前层的输出的感受野大小。

你可能感兴趣的:(学术)