填充 步幅 控制输出大小
padding stride
这里有一个吴恩达不同的点
(N+2P-K+1)/ S
个人觉得这个会好理解,但对于torch来说也是这么来计算padding 和stride的
填充可以增加输出的⾼度和宽度。这常⽤来使输出与输⼊具有相同的⾼和宽
步幅可以减小输出的⾼和宽,例如输出的⾼和宽仅为输⼊的⾼和宽的 1/n(n 是⼀个⼤于 1 的整数)
填充和步幅可⽤于有效地调整数据的维度
代码实现:
# 在所有侧边填充1个像素
import torch
from torch import nn
def comp_conv2d(conv2d, X): # conv2d 作为传参传进去,在内部使用
X = X.reshape((1,1)+X.shape) # 在维度前面加入一个通道数和批量大小数
Y = conv2d(X) # 卷积处理是一个四维的矩阵
return Y.reshape(Y.shape[2:]) # 将前面两个维度拿掉
conv2d = nn.Conv2d(1,1,kernel_size=3,padding=1) # padding=1 为左右都填充一行
X = torch.rand(size=(8,8))
print(comp_conv2d(conv2d,X).shape)
conv2d = nn.Conv2d(1,1,kernel_size=(5,3),padding=(2,1))
print(comp_conv2d(conv2d,X).shape)
# 将高度和宽度的步幅设置为2
conv2d = nn.Conv2d(1,1,kernel_size=3,padding=1,stride=2)
print(comp_conv2d(conv2d,X).shape)
# 一个稍微复杂的例子
conv2d = nn.Conv2d(1,1,kernel_size=(3,5),padding=(0,1),stride=(3,4))
print(comp_conv2d(conv2d,X).shape)
填充可以增加输出的⾼度和宽度。这常⽤来使输出与输⼊具有相同的⾼和宽
步幅可以减小输出的⾼和宽,例如输出的⾼和宽仅为输⼊的⾼和宽的 1/n(n 是⼀个⼤于 1 的整数)
填充和步幅可⽤于有效地调整数据的维度