cifar10 数据集介绍

基本信息

CIFAR-10 是一个包含60000张图片的数据集。其中每张照片为32*32的彩色照片,每个像素点包括RGB三个数值,数值范围 0 ~ 255。所有照片分属10个不同的类别,分别是 'airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'。其中五万张图片被划分为训练集,剩下的一万张图片属于测试集。

下载数据集

打开下面的链接进入官网下载

http://www.cs.toronto.edu/~kriz/cifar.html

cifar10 数据集介绍_第1张图片

查看文件

基于Python3.5

#python3
import numpy as np
import pickle
import os

CIFAR_DIR = "./cifar-10-batches-py"
print(os.listdir(CIFAR_DIR))

with open(os.path.join(CIFAR_DIR, "data_batch_1"), 'rb') as f:
	data = pickle.load(f, encoding='bytes')
	print(type(data))
	print(data.keys())
	print(type(data[b'data']))
	print(type(data[b'labels']))
	print(type(data[b'batch_label']))
	print(type(data[b'filenames']))
	print(data[b'data'].shape)
	print(data[b'data'][2:4])
	print(data[b'batch_label'])
	print(data[b'filenames'][2:4])

image = data[b'data'][100]
image = image.reshape((3,32,32)) #32 32 3
image = image.transpose((1,2,0))
#matplotlib inline
import matplotlib.pyplot as plt
from matplotlib.pyplot import imshow 
imshow(image)
plt.show()

运行结果如下:

cifar10 数据集介绍_第2张图片

cifar10 数据集介绍_第3张图片

你可能感兴趣的:(数据集)