卷积运算和特征图的理解

卷积运算和特征图的理解

卷积核在原图相应位置按指定步长滑动,做内积(相乘再相加再加上偏置)

如下图左边,输入图像为7×7×3, 3个数字矩阵分别代表RGB三通道,因此卷积核也必须是三通道的,这里使用3×3×3大小的卷积核,并且每个通道的卷积核的数值可以不一样(随机初始化),让每个通道的卷积核与每个通道的图像矩阵的对应位置做内积得到三个数值,将这三个数值相加再加上偏置得到卷积运算后的输出值

下图左边第一个特征图矩阵(3×3的绿色背景)中的数值3 = R通道×卷积核的第一个通道 + G通道×卷积核的第二个通道 + B通道×卷积核的第三个通道 + 偏置1 = 0 + 2 +0 + 1

注意:特征图的数量 = 卷积核的数量(比如图中有两个3×3×3大小的卷积核W0和W1)

特征图维度的理解:用一个三通道的卷积核与RGB图像做运算,得到一个H×M大小的特征图矩阵,同理,用2个三通道的卷积核与RGB图像做运算,得到H×M×2大小的特征图(增加成三维的了),用k个三通道的卷积核与RGB图像做运算,得到H×M×k大小的特征图矩阵(但还是看做三维)
卷积运算和特征图的理解_第1张图片

你可能感兴趣的:(pytorch学习笔记,卷积,人工智能)