空洞可分离卷积原理小结

空洞可分离卷积原理小结_第1张图片
图中从左到右分别为a、b、c子图,三幅图是相互独立进行卷积的(区别于下面图),大框表示输入图像(感受野默认为1),黑色的圆点表示[公式]的卷积核,灰色地带表示卷积后的感受野(后面有相关计算公式,这里都是一层卷积的,直接可以看出来)

a是普通的卷积过程(dilation rate = 1),卷积后的感受野为3
b是dilation rate = 2的空洞卷积,卷积后的感受野为5
c是dilation rate = 3的空洞卷积,卷积后的感受野为8
可以这么说,普通卷积是空洞卷积的一种特殊情况

另外,空洞卷积可以增大感受野,但是可以不改变图像输出特征图的尺寸(分辨率,resolution),这句话怎么理解?

为了更好地理解这一点,我们从一维去分析容易理解点

空洞可分离卷积原理小结_第2张图片

![从b和c可以看出,有无空洞卷积,并不影响输出特征图的尺寸,也就是说输出特征图的尺和空洞数无关,因此可以利用空洞卷积增大感受野,而输出特征图的尺寸可以保持不变【这里是通过调整padding达到的】

深度可分离卷积分为两步:

第一步用三个卷积对三个通道分别做卷积,这样在一次卷积后,输出3个数。
这输出的三个数,再通过一个1x1x3的卷积核(pointwise核),得到一个数。
所以深度可分离卷积其实是通过两次卷积实现的。

第一步,对三个通道分别做卷积,输出三个通道的属性:
第二步,用卷积核1x1x3对三个通道再次做卷积,这个时候的输出就和正常卷积一样,是8x8x1:
空洞可分离卷积原理小结_第3张图片
空洞可分离卷积原理小结_第4张图片
如果要提取更多的属性,则需要设计更多的1x1x3卷积核心就可以(图片引用自原网站。感觉应该将8x8x256那个立方体绘制成256个8x8x1,因为他们不是一体的,代表了256个属性):

空洞可分离卷积原理小结_第5张图片
可以看到,如果仅仅是提取一个属性,深度可分离卷积的方法,不如正常卷积。随着要提取的属性越来越多,深度可分离卷积就能够节省更多的参数。

转:https://blog.csdn.net/evergreenswj/article/details/92764387
https://zhuanlan.zhihu.com/p/113285797

你可能感兴趣的:(深度学习)