import torch
x=torch.randn(2,3,4,5)
conv1=nn.Conv2d(3,2,kernel_size=3)
out1=cov1(x)
print("output1 size: ",out1.shape)
conv2=nn.Conv2d(3,2,kernel_size=3,padding=1)
out2=cov2(x)
print("output2 size: ",out2.shape)
conv3=nn.Conv2d(3,2,kernel_size=3,padding=1,stride=2)
out3=cov3(x)
print("output3 size: ",out3.shape)
输出:
output1 size: torch.Size([2, 2, 2, 3])
output2 size: torch.Size([2, 2, 4, 5])
output3 size: torch.Size([2, 2, 2, 3])
X
batch_size:一个batch中样本的数量
in_channels:通道数,取决于样本的通道,比如RGB图像的通道数是3
height_1:图片的高
width_1:图片的宽
Conv2d的参数
channels:通道数,要与输入的通道数保持一致,channels=in_channels.
number:卷积核的数量
height_2:卷积核的高
width_2:卷积核的宽
batch_size:一个batch中样本的数量,与输入相同
out_channels:通道数,取决于卷积核的数量,与卷积核的数量number相等
height_3:卷积结果的高
width_3:卷积结果的宽
整个过程中出现了三次channels:
1、输入中in_channels,取决于输入图片的channels,如RGB图像是3。
2、卷积操作中的channels,要与输入中的in_channels保持一致才可以卷积。如果是第一次做卷积,就是1中样本图片的 channels,否则就是上一次卷积的 out_channels 。
3、输出结果中的out_channels,取决于卷积核的数量,与卷积核的数量大小相等(out_channels=number)。此时的 out_channels 也会作为下一次卷积时的卷积核的 in_channels。
卷积后图片大小的计算: n + 2 p − f s + 1 \frac{n+2p-f}{s}+1 sn+2p−f+1,n表示图像的长或者宽,p表示padding的大小,f 表示卷积核的大小,s表示步长。