多通道卷积理解

多通道卷积应用

例如:对于彩色图片有RGB三个通道,需要处理多输入通道的场景。输出特征图往往也会具有多个通道,而且在神经网络的计算中常常是把一个批次的样本放在一起计算,所以卷积算子需要具有批量处理多输入和多输出通道数据的功能。
多通道卷积理解_第1张图片
多通道卷积理解_第2张图片
多通道卷积理解_第3张图片
多通道卷积理解_第4张图片
多通道卷积理解_第5张图片
多通道卷积理解_第6张图片

批量操作

多通道卷积理解_第7张图片

  • conv2d 常用的参数如下:
    in_channels(int) - 输入图像的通道数。
    out_channels(int) - 卷积核的个数,和输出特征图通道数相同,相当于上文中的C(out)。
    kernel_size(int|list|tuple) - 卷积核大小,可以是整数,比如3,表示卷积核的高和宽均为3 ;或者是两个整数的list,例如[3,2],表示卷积核的高为3,宽为2。
    stride(int|list|tuple,可选) - 步长大小,可以是整数,默认值为1,表示垂直和水平滑动步幅均为1;或者是两个整数的list,例如[3,2],表示垂直滑动步幅为3,水平滑动步幅为2。
    padding(int|list|tuple|str,可选) - 填充大小,可以是整数,比如1,表示竖直和水平边界填充大小均为1;或者是两个整数的list,例如[2,1],表示竖直边界填充大小为2,水平边界填充大小为1。

你可能感兴趣的:(深度学习,神经网络,人工智能)