论文阅读笔记(十三)Xception

 

 

 

Xception: Deep Learning with Depthwise Separable Convolutions

Xception是在Inception结构的基础上通过加强假设:空间卷积和深度卷积不相关,分开操作效果更好,得到的。它先进行逐深度的空间卷积,再通过1*1卷积做深度卷积,将空间卷积和深度卷积解耦合。其参数与Inception V3大致相等,而取得的效果却比Inception V3更好,说明效果的提升不是来自于模型的表达能力,而是来自于模型结构的优化。当然Xception除了将Inception模块替换为深度可分离的卷积外,还汲取了Resnet的灵感,加入了残差设计。Xcepton由36层卷积层组成,可分成14个模块,除第一个和最后一个模块之外,其余模块间都有残差设计。深度可分离卷积和极致卷积之间的区别是:1)卷积的次序不同,前者先spatial convolution,后1*1卷积;后者先1*1卷积后spatial convolution。2)前者两个卷积之间没有relu激活,后者有。

网络结构如图所示:注意中间模块复制八次。所有的卷积操作都有BN。

 

论文阅读笔记(十三)Xception_第1张图片

实验结构:

1.和其他模型比较:

论文阅读笔记(十三)Xception_第2张图片

2. 和Inception做参数规模和训练速度比较:

论文阅读笔记(十三)Xception_第3张图片

论文阅读笔记(十三)Xception_第4张图片

 

3. 有无FC层影响:

论文阅读笔记(十三)Xception_第5张图片

论文阅读笔记(十三)Xception_第6张图片论文阅读笔记(十三)Xception_第7张图片

 

 

论文阅读笔记(十三)Xception_第8张图片

 4. pointwise convolution 后有无激活函数的影响:所以激活放在separable convolution的前面。

论文阅读笔记(十三)Xception_第9张图片

5. 残差的影响:

论文阅读笔记(十三)Xception_第10张图片

结论:

Xception在ImageNet上的收益不多,在JEF上的收益很大,与Inception相比。参数差不多。值得注意的是depthwise separable convolution也许不是最优的,最优和卷积可能介于其与Inception之间的若干离散状态。另外根据实验结果,有FC层,有残差连接,pointwise convolution后无relu激活效果最好!

 

转载于:https://www.cnblogs.com/ChinaField-blog/p/10823555.html

你可能感兴趣的:(论文阅读笔记(十三)Xception)