深度学习之图像分类模型inception v2、inception v3解读

一、简介



google发表的文章 http://arxiv.org/pdf/1512.00567v3.pdf中包含了inception v2与inception v3两种模型配置。
Inception v3单模型达到了21.2%的top1错误率,多模型达到了17.3%的top1错误率。


二、网络分析



文章地址如下: http://arxiv.org/pdf/1512.00567v3.pdf。
其设计思路的直觉是:
1. inception做了比较巧妙的几个动作,在增加特征表达能力的同时减少计算。
2. 模型更精巧复杂了,增加BN和gradient clipping去稳定训练。


其网络结构可以参考mxnet上的http://data.dmlc.ml/mxnet/models/imagenet/inception-v3.tar.gz。
网络中有如下的细节:
1.没有大的卷积核了,5x5用两个3x3代替,如图所示:

深度学习之图像分类模型inception v2、inception v3解读_第1张图片
2.两个3x1代替3x3卷积核,如下图所示:

深度学习之图像分类模型inception v2、inception v3解读_第2张图片
inception v2如下图所示:

三种inception种类如下:

深度学习之图像分类模型inception v2、inception v3解读_第3张图片

v2结构如下:

深度学习之图像分类模型inception v2、inception v3解读_第4张图片
inception v3是所有如下v2的结合:
 深度学习之图像分类模型inception v2、inception v3解读_第5张图片

其准确率是最后一行,v3在raw的v2上做了如下变化:RMSProp替代SGD,在类别全连接层后加入 LSR层,将7x7卷积核由三个3x3卷积核替代。

你可能感兴趣的:(deep,learning,计算机视觉,深度,学习论文与相关应用)