【深度学习 CNN】卷积神经网络模型--VGGNet(CNN )

VGGNet 网络结构诞生自牛津大学视觉几何组(Visual Geometry Group),也因此依照传统以作者VGG命名而来。

一、算法思想:

从网络设计思路来看,VGGNet是继承了AlexNet 的思路,以AlexNet 为基础,尝试建立了一个层次更多、深度更深的网络。其网络结构一样可以有8个层次所构成。也是5层卷积层,3层全连接层。最主要的区别在于,VGGNet的每个卷积网层并不是只做一次卷积操作,而是连续卷积2~4次。

二、VGGNet16算法步骤:
1、输入224*224像素RGB图片。
2、第一层使用3*3 的卷积核,卷积2次,每次输出64个特征图,并进行最大池化 max pooling。
3、第二层使用3*3 的卷积核,卷积2次,每次输出128个特征图,并进行最大池化 max pooling。
4、第三层使用3*3 的卷积核,卷积3次,每次输出256个特征图,并进行最大池化 max pooling。

5、第四层使用3*3 的卷积核,卷积3次,每次输出512个特征图,并进行最大池化 max pooling。
6、第五层使用3*3 的卷积核,卷积3次,每次输出512个特征图,并进行最大池化 max pooling。

7、第六层 、第七层 、第八层 使用全连接层,分别包含4096、4096、1000个隐层。也就是说,到全连接层只剩下1000个特征值;最后 经过 softmax 激活函数,得到最终分类结果。

三、VGGNet19算法步骤:
1、输入224*224像素RGB图片。
2、第一层使用3*3 的卷积核,卷积2次,每次输出64个特征图,并进行最大池化 max pooling。
3、第二层使用3*3 的卷积核,卷积2次,每次输出128个特征图,并进行最大池化 max pooling。
4、第三层使用3*3 的卷积核,卷积4次,每次输出256个特征图,并进行最大池化 max pooling。

5、第四层使用3*3 的卷积核,卷积4次,每次输出512个特征图,并进行最大池化 max pooling。
6、第五层使用3*3 的卷积核,卷积4次,每次输出512个特征图,并进行最大池化 max pooling。

7、第六层 、第七层 、第八层 使用全连接层,分别包含4096、4096、1000个隐层。也就是说,到全连接层只剩下1000个特征值;最后 经过 softmax 激活函数,得到最终分类结果。

VGG16和VGG19是其论文介绍效果最好的网络结构。VGG19的意思 是模型中含有19层计算含参数并可以被训练,包括16层卷积层和3层全连接层。

四、总结:
VGG最主要的贡献就是展示了当卷积网络的深度不断加深,是可以将识别准确度提高到更高的水平,并且全部使用3*3的卷积核也可以在保证特征提取效果的同时减少参数数量,使计算代价更小、收敛速度更快。

你可能感兴趣的:(数据科学--机器学习)