CNN学习笔记（二）

LeNet-5是一种用于手写体字符识别的非常高效的卷积神经网络。

网络包括七层结构：

LeNet网络结构.png

AlexNet是在LeNet的基础上加深了网络的结构，可以学习到更高维的图像特征。AlexNet包括8层权值网络层：五层卷积+三层全连接，使用了两块显卡训练了6天，在2012年ImageNet大赛上取得了冠军。

AlexNet网络在结构上的优化：

AlexNet络结构.png

在AlexNet的基础上，进行了微调：

使用了非常统一的串行结构，是传统CNN神经网络中最优的模型。

网络特点：

总结：

VGG网络结构.png

GoogleNet是基于Inception模块的深度神经网络模型。在2014年的ImageNet竞赛中夺得了冠军，在随后的两年中一直在改进，形成了Inception V2、Inception V3、Inception V4等版本。

网络特点：

使用较大的卷积核往往意味着巨大的运算量，理论已经证明，往往可以通过几个较小的卷积核来代替较大的卷积核，从而使得计算量的下降。

1）Inception原始网络结构，将1x1，3x3，5x5的conv和3x3的pooling堆叠在一起，一方面增加了网络的宽度，另一方面增加了网络对尺度的适应性。

原始结构.png

2）Inception改进后的网络结构，借鉴了的思想，在原先的卷积过程中使用的卷积，通过减少通道数，以期达到减少参数计算量的目的。

改进的结构.png

* NIN（network-in-network）
的卷积可以用来进行降维打破计算的瓶颈，同时也能增加网络的宽度，保持网络较高的性能。

* Inception结构参考链接：https://www.jianshu.com/p/d214112771b9

残差结构：

残差结构.png

ResNet模块：

ResNet模块.png

ResNet网络结构：

ResNet网络.png