课程学习笔记,课程链接
学习笔记同步发布在我的个人网站上,欢迎来访查看。
Pytorch的 nn模块有 Convolution Layers,有3种卷积操作,nn.Conv1d
、nn.Conv2d
、nn.Conv3d
分别对应一维二维以及三维:
注:在Pytorch 官网文档左侧,有 torch.nn和 torch.nn.fuctional,torch.nn 是对 torch.nn.fuctional进行了一个封装,方便用户使用。想细致的了解一些nn模块中的函数可以从 torch.nn.fuctional 入手。
这里主要介绍 nn.Conv2d
:
打开 torch.nn.fuctional 对应页面,可以看到对 conv2d 函数的介绍:
conv2d 需要的参数有 输入 input、权重 weight(更专业的名称是卷积核)、偏置 bias、步长 stride等。
举例:
左侧是输入图像,中间是卷积核,步长为1时,输出为最右侧的3*3的结果。
以此来编写程序:
import torch
import torch.nn.functional as F
input = torch.tensor([[1,2,0,3,1],
[0,1,2,3,1],
[1,2,1,0,0],
[5,2,3,1,1],
[2,1,0,1,1]])
kernel = torch.tensor([[1,2,1],
[0,1,0],
[2,1,0]])
input = torch.reshape(input, (1, 1, 5, 5))
kernel = torch.reshape(kernel, (1, 1, 3, 3))
output = F.conv2d(input, kernel, stride=1)
print(output)
输出;
与之前我们计算的结果一致。
这里需要注意是nn.fuctional.conv2d函数的对参数的shape有要求,shape中有四个参数,分别为 Size,Channel,Height,Width。可以用 torch.reshape
函数来进行 shape的设置。
padding是填充的意思,即在输入的四周进行填充,默认是0,不进行填充。
还是用上面的代码,不过将padding设置为1:
output = F.conv2d(input, kernel, stride=1, padding=1)