神经网络系列(三)--VGG 网络解析

VGG 网络结构

一、简介

VGG是牛津大学 Visual Geometry Group(视觉几何组)的缩写,在2014年,超越了Alex 获得了ImageNet 的亚军,VGG是在AlexNet基础上作了改进,增加了神经网络的深度与运用了小卷积核,使得结果更加精确。

二、网络结构

神经网络系列(三)--VGG 网络解析_第1张图片

三、特性

特性一:

采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核(11x11,7x7,5x5),两个3x3卷积核的堆叠相对于5x5卷积核的视野,三个3x3卷积核的堆叠相当于7x7卷积核的视野。这样一方面可以有更少的参数(3个堆叠的3x3结构只有7x7结构参数数量的(3x3x3)/(7x7)=55%);另一方面拥有更多的非线性变换,增加了CNN对特征的学习能力

例如:

3个3X3 的参数量为 3X(3X3)X (输入通道数的平方)

1个7X7 的参数量为 1X(7X7)X (输入通道数的平方)

如上减少了参数,也更有利于保持图像性质

特性二:

1x1卷积核的作用

在不影响感受野的情况下,增加模型的非线性

特性三:

采用了Multi-Scale的方法来训练和预测。可以增加训练的数据量,防止模型过拟合,提升预测准确率

你可能感兴趣的:(#,Base,Model)