图像卷积和池化操作后的特征图大小计算方法

一,卷积操作

若图像为正方形:设输入图像尺寸为WxW,卷积核尺寸为FxF,步幅为S,Padding使用P,经过该卷积层后输出的图像尺寸为NxN:

N=\frac{W-F+2P}{S}+1

 

若图像为矩形:设输入图像尺寸为WxH,卷积核的尺寸为FxF,步幅为S,图像深度(通道数)为C,Padding使用P,则:

卷积后输出图像大小:

                                 W=\frac{W-F+2P}{S}+1    ,   H=\frac{H-F+2P}{S}+1  ,  输出图像的通道数=C 

注意:Padding的作用用于解决图像边缘信息损失的问题

图像卷积和池化操作后的特征图大小计算方法_第1张图片

如same:(same模式只有步长为1时,输入和输出的尺度才相同)

输入特征图为5x5,卷积核为3x3,外加padding 为1,则其输出尺寸为 \frac{5-3+2\times 1}{1}+1 = 5

 

二,池化操作

设输入图像尺寸为WxH,其中W:图像宽,H:图像高,D:图像深度(通道数),卷积核的尺寸为FxF,S:步长

池化后输出图像大小:

                                   W=\frac{W-F}{S}+1

                                   H=\frac{H-F}{S}+1

池化后输出图像深度为D
 

当进行池化操作时,步长S就等于池化核的尺寸,如输入为24x24,池化核为4x4,则输出为\frac{24-4}{4}+1 = 6

若除不尽,则取较小的数,如池化核为7x7,则输出为\frac{24-7}{7}+1 = 3.428 =3,不是用四舍五入,就是取最小的整数,即使为3.9,也是 取3

 

三,空洞卷积(也称扩张卷积,膨胀卷积)--dilated convolution

W=\frac{W-d(k-1)-1+2p}{s}+1

其中 d为空洞卷积的空洞率(正常的卷积d=1),p为padding,k为kernel size

举个例子:

下面的空洞卷积核是d=2,k=2的空洞卷积卷积核。

当d=2,k=2时,-d(k-1)-1 = -3,即相当于 一个k=3的正常卷积核。下图的正好是3x3的。

图像卷积和池化操作后的特征图大小计算方法_第2张图片

你可能感兴趣的:(#,神经网络)