6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现

以前对多通道和多通道输入输出的卷积操作不理解,今天自己在草稿纸上画图推理了一遍,终于弄懂了。希望能帮助到大家。

多通道可视化

一通道的2x2矩阵

torch.Size([2,2]) 相当于 torch.Size([1,2,2]),是一通道的2x2矩阵
6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_第1张图片

二通道的 2x2矩阵

torch.Size([2,2,2])代表二通道的 2x2矩阵 ,第一个2表示通道
6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_第2张图片

三通道的2x2x2矩阵

torch.Size([3,2,2,2])6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_第3张图片

多输入通道代码,输出通道为1的卷积操作代码

代码

import torch
from d2l import torch as d2l
'''
    多输入通道,输出单通道
    for x,k in zip(X,K)是取出每个通道的图像矩阵 和 对应的卷积核。
    对每个通道对应的的像素矩阵和卷积核进行计算最后相加合到一起
'''
def corr2d_multi_in(X,K):
    return sum(d2l.corr2d(x,k) for x,k in zip(X,K))

X = torch.tensor([[[0, 1, 2],
                   [3, 4, 5],
                   [6, 7, 8]],
                  [[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]]])
K = torch.tensor([[[0, 1],
                   [2, 3]],
                  [[1, 2],
                   [3, 4]]])
print(result)
print(result.shape)

输出结果:

tensor([[ 56.,  72.],
        [104., 120.]])
torch.Size([2, 2])

结果可视化

6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_第4张图片

多输入和多输出通道的卷积操作代码

代码

'''多输入和多输出通道'''
def corr2d_multi_in_out(X,K):
    # 注意,没有遍历X,此时的X是大写
    return torch.stack([corr2d_multi_in(X,k) for k in K],0)

K = torch.tensor([[[0, 1],
                   [2, 3]],
                  [[1, 2],
                   [3, 4]]])
K = torch.stack((K,K+1,K+2),0)
K.shape

torch.Size([3, 2, 2, 2])

result = corr2d_multi_in_out(X,K)
print(result)
print(result.shape)
tensor([[[ 56.,  72.],
         [104., 120.]],

        [[ 76., 100.],
         [148., 172.]],

        [[ 96., 128.],
         [192., 224.]]])
torch.Size([3, 2, 2])

可视化

6.4 (通俗易懂)可视化详解多通道 & 多通道输入输出卷积代码实现_第5张图片

你可能感兴趣的:(动手学深度学习(计算机视觉篇),深度学习,pytorch,计算机视觉)