图像分类CNN经典网络(一)AlexNet与VGG

本篇文章总结了CNN领域用于图像分类的两个网络AlexNet与VGGNet。

在图像分类领域,CNN有了很好的应用,下图展示了2012年之后的一些经典的网络架构。
图像分类CNN经典网络(一)AlexNet与VGG_第1张图片

AlexNet

AlexNet是打开卷积神经网络大门的第一个作品,它重新将卷积神经网络带入计算机视觉的科研中。他给出了卷积神经网络在目标检测中的基本思想。
注意要特点又
1、ReLU、双GPU运算:提高训练速度。(应用于所有卷积层和全连接层)
2、重叠pool池化层:提高精度,不容易产生过度拟合。(应用在第一层,第二层,第五层后面)
3、局部响应归一化层(LRN):提高精度。(应用在第一层和第二层后面)
4、Dropout:减少过度拟合。(应用在前两个全连接层)
图像分类CNN经典网络(一)AlexNet与VGG_第2张图片

VGGNet

VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。它探索了卷积神经网络的深度和其性能之间的关系,通过反复的堆叠33的小型卷积核和22的最大池化层,成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年比赛的亚军和定位项目的冠军,在top5上的错误率为7.5%。

VGGNet的网络结构如下图所示。VGGNet包含很多级别的网络,深度从11层到19层不等,比较常用的是VGGNet-16和VGGNet-19。VGGNet把网络分成了5段,每段都把多个3*3的卷积网络串联在一起,每段卷积后面接一个最大池化层,最后面是3个全连接层和一个softmax层。

图像分类CNN经典网络(一)AlexNet与VGG_第3张图片
我们以VGG16做一个分析
下图给出了VGG16的一个内存占用和参数量的分析。
图像分类CNN经典网络(一)AlexNet与VGG_第4张图片

VGG特点总结如下:

1、至今,VGGNet仍然是现如今搭建基本的CNN网络的基本网络,很多网络构建初期都是在VGG的基础上搭建。
2、网络在创新上提出了用小的卷积核代替大卷积的思想。用两个3*3的卷积核去替代5*5的卷积核,用三个3*3的卷积核代替7*7的卷积核。
如何理解?
可以看下图原来一个55的区域要用一个核卷积,如今先用个33的核来卷积得到第二层的图,图纸考虑是步长为1的情况,此时最底层移动三次可以把5*5的区域遍历到,然后得到第二层3*3的图。然后再用3*3的核对第二层卷积得到顶层一个。这样就达到用用两个3*3的卷积核去替代5*5的卷积核。很巧妙!!
图像分类CNN经典网络(一)AlexNet与VGG_第5张图片
使用尺寸小的卷积的好处?
(1)更少的参数量;
(2)更多的非线性变换,使得CNN对特征的学习能力更强表达能力增强;
(3)隐式的正则化效果(收敛速度要快)。

参考文献

[1]AlexNet详细解读
https://blog.csdn.net/qq_24695385/article/details/80368618
[2]VGGNet介绍
https://blog.csdn.net/u013181595/article/details/80974210
[3]卷积神经网络的网络结构——VGGNet
https://www.imooc.com/article/34700
[4]大话CNN经典模型:
https://my.oschina.net/u/876354/blog/1634322

你可能感兴趣的:(计算机视觉,计算机视觉CV)