pytorch中的nn.Conv2d()如何控制输出的形状

大家想必在构建网络结构的时候都会遇到一个问题,那就是如何设置卷积核的参数来控制输出张量的形状,本文就这个问题来对conv2d函数进行一个讲解。

首先,我们来看一下Conv2D的参数:

nn.Conv2d( in_channels, out_channels, kernel_size, stride=1,
                 padding=0)

in_channels: 输入维度

out_channels: 输出维度

kernel_size: 卷积核大小

stride: 步长大小(默认为1)

padding: 填充的大小(补0)

输出的维度由out_channel来进行设定,而输出的尺寸则是由输入尺寸(input_size),卷积核大小(kernel_size),步长(stride),以及填充大小(padding)共同决定了,具体的公式如下所示:

output_size = [(input_size + 2*padding - kernel_size) / stride] +1

所以如果你需要输出某个特定尺寸的话就需要根据公式进行计算啦,当然了大多数情况下,其卷积核和步长是固定的,所以往往需要自己计算和设定的就是padding了。

下面,我以一个具体的例子来进行讲解:

conv1=nn.Conv2d(1,2,kernel_size=3,padding=1)
conv2=nn.Conv2d(1,2,kernel_size=3)
inputs=torch.Tensor([[[[1,2,3],
                      [4,5,6],
                      [7,8,9]]]])
print("input size: ",inputs.shape)
outputs1=conv1(inputs)
print("output1 size: ",outputs1.shape)
outputs2=conv2(inputs)
print("output2 size: ",outputs2.shape)
输出:
input size: torch.Size([1, 1, 3, 3])
output1 size: torch.Size([1, 2, 3, 3])
output2 size: torch.Size([1, 2, 1,

以上这篇pytorch nn.Conv2d()中的padding以及输出⼤⼩⽅式就是⼩编分享给⼤家的全部内容了,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。
 

你可能感兴趣的:(深度学习,cnn,人工智能,python,pytorch)