普通卷积与深度可分离卷积的区别

普通卷积与深度可分离卷积的区别

本文来源于:普通卷积与深度可分离卷积的区别

1、普通卷积的卷积方式

原始图像是二维的,大小是12x12。由于是RGB格式的,所以有三个通道,这相当于是一个3维的图片。其输入图片格式是:12x12x3。滤波器窗口大小是5x5x3。这样的话,得到的输出图像大小是8x8x1(padding模式是valid)。

普通卷积与深度可分离卷积的区别_第1张图片

对于一张12×12像素、三通道(shape为12×12×3)的图像,经过5×5卷积核的卷积层,卷积核的通道应该和输入图像的通道数相同,其卷积核个数决定了最后的输出特征图个数,就是输出通道;假设输出通道数为1,则卷积核shape为3×5×5×1,最终输出1个Feature Map,如果有same padding则尺寸与输入层相同(12×12x1),如果没有则为尺寸变为(8×8x1):12x12x3 * 5x5x3x1 => 8x8x1

普通卷积运行正常卷积过程时,一个卷积核只能得到一个特征,如上图所示,一个卷积核3x5x5可以得到的输出特征图为8x8x1,仅仅提取到了图片的一个属性,如果希望获取更多的属性,则需要更多的滤波器。如果希望获取图片更多的属性,譬如要提取256个属性,如下图所示:
普通卷积与深度可分离卷积的区别_第2张图片

12x12x3 * 5x5x3x256 => 8x8x256,可以创建256个卷积核来创建256个8x8x1图像,然后将它们堆叠在一起便可创建8x8x256的图像输出。
正常卷积的问题在于,它的卷积核是针对图片的所有通道设计的(通道的总数就是depth)。那么,每要求增加检测图片的一个属性,卷积核就要增加一个。所以正常卷积,一个正常卷积层的完整卷积核格式应该为(输入通道数x卷积核高x卷积核宽);卷积参数的总数=属性的总数x卷积核的大小

2、深度可分离卷积

深度可分离卷积的方法有所不同。正常卷积核是对3个通道同时做卷积。也就是说,3个通道,在一次卷积后,输出一个数。
深度可分离卷积分为两步:
(1)用三个卷积对三个通道分别做卷积,这样在一次卷积后,输出3个数。
(2)这输出的三个数,再通过一个1x1x3的卷积核(pointwise核),得到一个数。所以深度可分离卷积其实是通过两次卷积实现的。
第一步,对三个通道分别做卷积,输出三个通道的属性:
普通卷积与深度可分离卷积的区别_第3张图片

具体运算过程如下所示:
普通卷积与深度可分离卷积的区别_第4张图片

第二步,用卷积核1x1x3对三个通道再次做卷积,这个时候的输出就和正常卷积一样,是8x8x1:
普通卷积与深度可分离卷积的区别_第5张图片

这步就是正常的卷积过程,只是卷积核大小为(3x1x1),一个卷积核得到一个特征图;8x8x3 * 1x1x3x1 => 8x8x1。
如果要提取更多的属性,则需要设计更多的1x1x3卷积核心就可以(图片引用自原网站。感觉应该将8x8x256那个立方体绘制成256个8x8x1,因为他们不是一体的,代表了256个属性):
普通卷积与深度可分离卷积的区别_第6张图片

可以看到,如果仅仅是提取一个属性,深度可分离卷积的方法,不如正常卷积。随着要提取的属性越来越多,深度可分离卷积就能够节省更多的参数。

参考https://blog.csdn.net/evergreenswj/article/details/92764387

你可能感兴趣的:(目标检测,深度学习,计算机视觉,cnn)