CIFAR-10 数据集

之前研究过ImageNet数据集,感觉它们的组织的还是很有趣的,还有一些脚本的编写。

CIFAR-10 数据集简介

CIFAR-10 是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图 片:飞机( a叩lane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。图片的尺寸为 32×32 ,数据集中一共有 50000 张训练圄片和 10000 张测试图片。 CIFAR-10 的图片样例如图所示。
下面这幅图就是列举了10各类,每一类展示了随机的10张图片:
在这里插入图片描述

与 MNIST 数据集中目比, CIFAR-10 具有以下不同点:
• CIFAR-10 是 3 通道的彩色 RGB 图像,而 MNIST 是灰度图像。
• CIFAR-10 的图片尺寸为 32×32, 而 MNIST 的图片尺寸为 28×28,比 MNIST 稍大。
• 相比于手写字符, CIFAR-10 含有的是现实世界中真实的物体,不仅噪声很大,而且物体的比例、 特征都不尽相同,这为识别带来很大困难。 直接的线性模型如 Softmax 在 CIFAR-10 上表现得很差。

数据集下载

官方下载地址:(很慢)

(共有三个版本:python,matlab,binary version 适用于C语言)
http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

http://www.cs.toronto.edu/~kriz/cifar-10-matlab.tar.gz

http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz

csdn下载地址

代码下载地址

首先下载tensorflow官方CIFAR-10代码:https://github.com/tensorflow/models
模块位于models/tutorials/image/cifar10目录下
在这里插入图片描述

更多参考:

https://www.cnblogs.com/cloud-ken/p/8456878.html
https://detail.zol.com.cn/1279/1278505/param.shtml
https://github.com/TensorVision/MediSeg/blob/master/model/VGG8.py
https://www.kaggle.com/lucasobara/theano-vgg8
https://www.pianshen.com/article/6340265282/
https://aistudio.baidu.com/aistudio/projectdetail/476321

你可能感兴趣的:(人工智能-神经网络,Matlab,Python使用技巧)