RGB图像卷积生成Feature map特征图过程

RGB图像卷积生成Feature map特征图过程_第1张图片

 RGB图像有R、G、B三个通道,与之卷积的(每个,为什么说每个,这一次卷积完会输出特征图feature map,因为卷积核的个数决定了这一次卷积之后的输出的通道数,这个通道数就是说有多少张feature map(有多少张特征图),【卷积核相当于一个提取特征函数,输入图片,经过这个函数,得到特征图】,每个卷积核在卷积过后会生成一张feature map,一个卷积核提取的特征会呈现在它对应的那张feature map中,卷积核的个数在实际操作过程中通常会设置一些初始的预设值,可以根据最终模型效果来微调整)卷积核都是R、G、B构成的。RGB原输入图像如果是(3,512,512),即(通道数,图高,图宽),则他的卷积核都要满足(3,kernel_size_h,kernel_size_w),h=w=奇数。深度学习的的卷积虽然说是卷积,但这个过程其实是互相关运算(如上图所示就是随着kernel的滑动,每次卷积就是两个矩阵元素的对应项相乘再相加,而不是两个矩阵相乘)。

那3通道的RGB的输入图和一个3通道的卷积核是如何经过卷积变成了一张二维的feature map的呢?根据上面红字所说,每一次滑动,输入图的R通道与卷积核R通道卷积后会得到一个数(对应项目相乘相加最终会得到一个数),G、B通道同理也会分别得到一个数,分别记作 数_cov_R,数_cov_G,数_cov_B,这三个数再相加,得到的初步结果数记作res0_i_j,这个res0_i_j 再加上一个bias值就会得到这一次”卷积运算“的结果 res_i_j 了,这个结果是feature map元素矩阵的一个元素的值。随着卷积核在输入原图的RGB图像上滑动,逐渐生成一整张feature map(一个矩阵)的元素值,即可得到一张feature map。多个卷积核就会生成不同的feature map ,每个卷积核可以设置不同的bias。

你可能感兴趣的:(深度学习,计算机视觉,深度学习,人工智能)