CVPR 2017精彩论文解读:Xception深度可分离卷积模型

论文地址:Xception: Deep Learning with Depthwise Separable Convolutios

Inception模块有别于VGG等传统的网络通过堆叠简单的3*3卷积实现特征提取,Inception模块通过组合1*1,3*3,5*5和pooling等结构,用更少的参数和更少的计算开销可以学习到更丰富的特征表示。

通常,在一组特征图上进行卷积需要三维的卷积核,也即卷积核需要同时学习空间上的相关性和通道间的相关性。将这两种相关性显式地分离开来,是Inception模块的思想之一:Inception模块首先使用1*1的卷积核将特征图的各个通道映射到一个新的空间,在这一过程中学习通道间的相关性;再通过常规的3*3或5*5的卷积核进行卷积,以同时学习空间上的相关性和通道间的相关性。

但此时,通道间的相关性和空间相关性仍旧没有完全分离,也即3*3或5*5的卷积核仍然是多通道输入的,那么是否可以假设它们可以被完全分离?显然,当所有3*3或5*5的卷积都作用在只有一个通道的特征图上时,通道间的相关性和空间上的相关性即达到了完全分离的效果。

若将Inception模块简化,仅保留包含3*3的卷积的分支:

CVPR 2017精彩论文解读:Xception深度可分离卷积模型_第1张图片

再将所有1*1的卷积进行拼接:

CVPR 2017精彩论文解读:Xception深度可分离卷积模型_第2张图片

进一步增多3*3的卷积的分支的数量,使它与1*1的卷积的输出通道数相等:

CVPR 2017精彩论文解读:Xception深度可分离卷积模型_第3张图片

此时每个3*3的卷积即作用于仅包含一个通道的特征图上,作者称之为“Extream Inception”模块,这就是Xception的基本模块。事实上,调节每个3*3的卷积作用的特征图的通道数,即调节3*3的卷积的分支的数量与1*1的卷积的输出通道数的比例,可以实现一系列处于传统Inception模块和“Extreme  Inception”模块之间的状态。

运用“Extreme  Inception”模块,作者搭建了Xception网络,它由一系列SeparableConv(即“Extreme  Inception”)、类似ResNet中的残差连接形式和一些其他常规的操作组成:

CVPR 2017精彩论文解读:Xception深度可分离卷积模型_第4张图片

你可能感兴趣的:(CNN,深度学习,CNN,XCeption)