keras从入门到放弃(十六)内置预训练网络VGG

什么是预训练网络

一个常用、高效的在小图像数据集上深度学习的方法就是利用预训练网络。一个预训练网络只是简单的储存了之前在大的数据集训练的结果,通常是大的图像分类任务。如果原始的数据集已经足够大,足够一般,通过预训练学习到的空间上的特征层次结构就能有效地在我们的模型中工作,因此这些特征对许多计算机视觉问题都很有用,尽管这些新问题和原任务相比可能涉及完全不同的类别。

Keras内置预训练网络 Keras库中包含

  • VGG16、VGG19、
  • ResNet50、
  • Inception v3、
  • Xception等经典的模型架构。

ImageNet是一个手动标注好类别的图片数据库(为了机器视 觉研究),目前已有22,000个类别。ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释,以指示图片中的对象;在至少一百万个图像中,还提供了边界框。ImageNet包含2万多个类别; [2]一个典型的类别,如“气球”或“草莓”,包含数百个图像。第三方图像URL的注释数据库可以直接从ImageNet免费获得;但是,实际的图像不属于ImageNet。自2010年以来,ImageNet项目每年举办一次软件比赛,即ImageNet大规模视觉识别挑战赛(ILSVRC),软件程序竞相正确分类检测物体和场景。 ImageNet挑战使用了一个“修剪”的1000个非重叠类的列表。2012年在解决ImageNet挑战方面取得了巨大的突破,被广泛认为是2010年的深度学习革命的开始。

VGG16与VGG19

在2014年,VGG模型架构由Simonyan和Zisserman提出, 在“极深的大规模图像识别卷积网络”(Very Deep Convolutional Networks for Large Scale Image Recognition)这篇论文中有介绍

VGG模型结构简单有效,前几层仅使用3×3卷积核来增加网 络深度,通过max pooling(最大池化)依次减少每层的神 经元数量,最后三层分别是2个有4096个神经元的全连接层 和一个softmax层

你可能感兴趣的:(零基础学习深度学习)