阅读笔记4——感受野

一、概念

  感受野是指特征图上的某个点能看到的输入图像的区域,即特征图上的点是由输入图像中感受野大小的区域经过计算得到的。

二、示意图

  图2-1所示为一个三层卷积网络,每一层的卷积核大小为 3 × 3 3×3 3×3,步长为 1 1 1

阅读笔记4——感受野_第1张图片

图2-1 感受野示意图
  • 第一层感受野大小

阅读笔记4——感受野_第2张图片

图2-2 第一层感受野示意图

  如图2-2所示,第一层特征图中的一个点对应输入图像的区域大小为 3 × 3 3×3 3×3,因此第一层特征图的感受野大小为 3 × 3 3×3 3×3

  • 第二层感受野大小

阅读笔记4——感受野_第3张图片

图2-3 第二层感受野示意图

  如图2-3所示,第二层特征图中的一个点对应输入图像的区域大小为 5 × 5 5×5 5×5,因此第二层特征图的感受野大小为 5 × 5 5×5 5×5

  • 第三层感受野大小
    阅读笔记4——感受野_第4张图片
图2-4 第三层感受野示意图

  如图2-4所示,第三层特征图中的一个点对应输入图像的区域大小为 7 × 7 7×7 7×7,因此第二层特征图的感受野大小为 7 × 7 7×7 7×7

三、计算公式

  卷积层和池化层都会影响感受野,而激活函数层通常对感受野没有影响。对于一般的卷积神经网络,感受野可由式(3-1)和式(3-2)计算得出。

R F l + 1 = R F l + ( k − 1 ) × S l (3-1) RF_{l+1}=RF_{l}+\left ( k-1 \right )\times S_{l} \tag{3-1} RFl+1=RFl+(k1)×Sl(3-1)

S l = ∏ i = 1 l S t r i d e i (3-2) S_{l}=\prod_{i=1}^{l}Stride_{i} \tag{3-2} Sl=i=1lStridei(3-2)

  其中, R F l + 1 RF_{l+1} RFl+1 R F l RF_{l} RFl分别代表第 l + 1 l+1 l+1层与第 l l l层的感受野, k k k代表第 l + 1 l+1 l+1层卷积核的大小, S l S_{l} Sl代表前 l l l层的步长之积。注意,当前层的步长并不影响当前层的感受野

四、有效感受野

  通过式(3-1)和式(3-2)求取出的感受野通常很大,而实际的有效感受野往往小于理论感受野

  从图2-4中可以看出,虽然第三层的感受野是 7 × 7 7×7 7×7,但是输入层中边缘点的使用次数明显比中间点要少,因此做出的贡献不同。

  经过多层的卷积堆叠之后,输入层对于特征图点做出的贡献分布呈高斯分布形状。

你可能感兴趣的:(计算机视觉,人工智能,深度学习)