MNIST数据集 & CIFAR10数据集

MNIST数据集

      MNIST数据集是分类任务中最简单、最常用的数据集。人为的手写了0-9数字的图片

      MNIST大概有7w张


MNIST数据值都是灰度图,所以图像的通道数只有一个

 

因为MNIST数据集是专门为深度学习来的,所以其数据集格式和我们常见的很不一样,但是在Pytorch/Tensorflow中有函数可以很容易的读取,如果用普通Python来读取则不是那么容易

MNIST数据集 & CIFAR10数据集_第1张图片

MNIST数据集 & CIFAR10数据集_第2张图片

 

 

CIFAR10数据集

http://www.cs.toronto.edu/~kriz/cifar.html

CIFAR10数据集比MNIST要复杂一些. CIFAR10是真实数据集,MNIST是人为构建的

CIFAR10是32*32的

 

有CIFAR-10和CIFAR-100

CIFAR-10图片的10种类别,每一类大概有6000张

一共6w张照片,其中用于训练的5w张,用于test的1w张

MNIST数据集 & CIFAR10数据集_第3张图片

飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车

 

 

下载后文件夹内部是这样

MNIST数据集 & CIFAR10数据集_第4张图片

解压后得到5个batch_data,1个test_batch,还有一个batches.meta。这些数据文件是Python的‘pickle’的对象,需要用相应的方法才能读出来

 

 

你可能感兴趣的:(CIFAR-10,1024程序员节)