VGG网络

论文传送门:https://arxiv.org/pdf/1409.1556.pdf

VGG网络是十分经典的CNN网络模型,在特征提取和迁移学习任务中都经常被使用。其中使用最广泛的是VGG16和VGG19,分别代表网络层级为16层和19层。

VGG在文章《Very deep convolutional networks for large-scale image recognition》中提出,为了解决ImageNet大赛上1000类图像分类和定位问题,在网络深度不断加深的过程中,文章的实验表明,16层和19层在该任务上效果最好。

VGG分别夺得ImageNet Challenge 2014t的分类第二(第一是GoogleNet)和定位第一。VGG网络的命名是以牛津大学的Visual Geometry Group的名字缩写得到的。

VGG网络设计

关键点

  1. 采用3x3卷积核,小卷积核
  2. 卷积步长为1,不丢失信息

其它细节

  1. 采用ReLU非线性激活函数
  2. 5个最大池化层
  3. 无归一化
  4. 3层全连接层

采用3x3 layers的原因

  1. 堆叠后的卷积层具有更大的感受野
  2. 更加的非线性
  3. 参数的数量减少

网络配置

在文章中作者共做了六组实验,网络层数从11怎加到19,六个网络结构的配置如下:
其中D和E为VGG16和VGG19的网络配置。
VGG网络_第1张图片

六个网络对应的参数数量(百万级)如下:

在这里插入图片描述

全连接层配置:

VGG的三层全连接层的配置和AlexNet的全连接层配置基本相同:

FC4096 - ReLU - Dropout05,(std=0.005,bias=0.1)
FC4096 - ReLU - Dropout05,(std=0.005,bias=0.1)
FC1000 - SoftMax,(std=0.005,bias=0.1)

总结

  1. 加深网络深度提高网络的性能
  2. 使用更小的3*3卷积核和更深的网络层数,拥有更少的参数并有更好的非线性变换能力。
  3. 在最后三个阶段采用1*1卷积核,不影响输出维度,减少计算量。

你可能感兴趣的:(项目实训)