Receptive field(感受野)

感受野用来表示网络内部的不同神经元对原图像的感受范围的大小,或者说,convNets(cnn)每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。
我们可以通过逆向思维理解感受野,如下:
两层 3×3 卷积操作的有效区域(感受野)是5×5 (所有filter的stride=1,pad=0),示意图如下:Receptive field(感受野)_第1张图片
三层3×3卷积核操作的有效区域是7×7 (所有filter的stride=1,pad=0),示意图如下:
Receptive field(感受野)_第2张图片

  1. 神经元之所以无法对原始图像的所有信息进行感知,是因为在这些网络结构中普遍使用卷积层和pooling层,在层与层之间均为局部连接。
  2. 神经元感受野的值越大表示其能接触到的原始图像范围就越大,也意味着它可能蕴含更为全局,语义层次更高的特征;相反,值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。
  3. 这就是为何在 《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》 文章中提到It is easy to see that a stack of two 3 × 3 conv. layers (without spatial pooling in between) has an effective receptive field of 5 × 5; three such layers have a 7 × 7 effective receptive field. 也就是说两层 3x3 的卷积层直接堆叠后(无池化)可以算的有感受野是 5x5,三层堆叠后的感受野就是 7x7。

你可能感兴趣的:(深度学习,卷积网络中的重要概念理解,感受野(receptive,field))