深度学习(一):深度学习图像数据库详解

1. MNIST手写数字分类图像集

地址:http://yann.lecun.com/exdb/mnist/

手写数字识别图像库,共70000张图片,其中60000张训练集图片,10000张测试集图片,图像大小28x28,黑底白字样式

train-images-idx3-ubyte.gz:训练集图片

train-labels-idx1-ubyte.gz:训练集图片对应数字标签

t10k-images-idx3-ubyte.gz:测试集图片

t10k-labels-idx1-ubyte.gz:测试集图片对应数字标签

下载后需转为lmdb或leveldb格式

 

2. CIFAR分类图像集

CIFAR-10图像集包含60000张32x32的彩色图片,共分10个类别,每个类别6000张图片。其中50000张为训练集图片,10000张为测试集图片。训练集中每个类别5000张图片,测试集中每个类别1000张图片,训练集与测试集中图片类别均随机分布。

图片共10个类别,包括:飞机、小汽车(含轿车与SUV)、鸟、猫、鹿、狗、青蛙、马、船、卡车(仅含大卡车,不含皮卡)。

深度学习(一):深度学习图像数据库详解_第1张图片

链接中有3个不同格式的版本可下载:

  • CIFAR-10 python version:适用于Tensorflow、Pytorch等基于Python开发的框架
  • CIFAR-10 Matlab version:适用于Matlab
  • CIFAR-10 binary version (suitable for C programs):适用于Caffe,下载后需转为lmdb或leveldb格式

CIFAR-10 binary version (suitable for C programs)解压后如下所示,训练集图片分为5个包(batch),每个包都为bin后缀,每个包有10000张图片。测试集有1个包,包含10000张图片。训练集中可能有的包的类别中的图片数可能多于其他类别的,但总的来说,所有训练集中每个类别都是5000张图片。

深度学习(一):深度学习图像数据库详解_第2张图片

CIFAR-100 包含60000张图片,共100个类别,每个类别600张图片。其中训练集50000张,每个类别500张。测试集10000张,每个类别100张。CIFAR-100的100个类别,又可分为20个大类(superclass),每张图片包含所属的精准类(即100个类别中的类),以及所属的大类的类别。分属的类别如下:

深度学习(一):深度学习图像数据库详解_第3张图片

3. Pascal VOC 

Pascal VOC挑战赛是视觉对象分类识别与检测的一个基准测试,从2005年到2012年每年都举行一场图像识别的挑战赛。2012年后不再举办,但其数据质量好,标注完备,非常适合用来测试算法性能。较常用的Pascal VOC数据集有Pascal VOC2007与Pascal VOC2012。

Pascal VOC2007图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。总共9963张图片包含24640这个标注对象。

深度学习(一):深度学习图像数据库详解_第4张图片

待续。。。

你可能感兴趣的:(深度学习)