VGG

VGG的网络结构图

VGG_第1张图片
由上图所知,VGG一共有五段卷积,每段卷积之后紧接着最大池化层,作者一共实验了6种网络结构。分别是VGG-11,VGG-13,VGG-16,VGG-19,网络的输入是224*224大小的图像,输出是图像分类结果
VGG与Alexnet相比,具有如下改进几点:

  • 去掉了LRN层,作者发现深度网络中LRN的作用并不明显,干脆取消了
  • 采用更小的卷积核-3x3,Alexnet中使用了更大的卷积核,比如有7x7的,因此VGG相对于Alexnet而言,参数量更少
  • 池化核变小,VGG中的池化核是2x2,stride为2,Alexnet池化核是3x3,步长为2

首先为了更好的探究深度对网络的影响,必须要解决参数量的问题,更深的网络意味着更多的参数,训练更困难,使用大卷积核时尤其明显.作者通过分析,认为由于卷积神经网络的特性,3x3大小的卷积核足以捕捉到横、竖以及斜对角像素的变化。使用大卷积核会带来参数量的爆炸不说,而且图像中会存在一些部分被多次卷积,可能会给特征提取带来困难,所以在VGG中,普遍使用3x3的卷积。

VGG16

VGG_第2张图片VGG_第3张图片

你可能感兴趣的:(机器学习与深度学习)