VGG:Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记

论文原文:Very Deep Convolutional Networks forLarge-Scale Image Recognition

网络模型名字:VGG-16、VGG-19


1、简介

    2014年ImageNet亚军。本文主要研究了卷积神经网络深度对大尺度图像识别精度的影响。在现有网络结构的基础上,不断增加3*3卷积核,当深度增加到16-19层时,识别效果有较大提升,即VGG-16,VGG-19。

    VGG不仅在分类定位中表现优异,而且可以应用到其他场景。faster rcnn、fast rcnn中特征提取部分应用了VGG-16网络。

2、网络基本构成及方法

    训练输入为224*224大小的RGB图像,需要减去图像均值。用一堆3*3,1*1小卷积核进行卷积,连接max pooling。最后,连接3个全连接层,softmax分类器。

    网络结构使用Relu激活函数,几乎不用LRN(Local Response Normalisation)。

VGG:Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记_第1张图片

    VGG网络结构:

    模型A-E:只增加深度,其他不变(增加3*3卷积核)

VGG:Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记_第2张图片

    测试效果:

VGG:Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记_第3张图片



你可能感兴趣的:(CNN图像分类)