李沐-动手学深度学习-图像分类数据集

MNIST数据集是图像中广泛使用的数据集之一,但作为基准数据集过于简单。我们将使用类似但更复杂的Fashion-MNIST数据集。

李沐-动手学深度学习-图像分类数据集_第1张图片

通过框架中的内置函数将Fashion-MNIST数据集下载并读取到内存中。Fashion-MNIST由10个类别的图像组成, 每个类别由训练数据集(train dataset)中的6000张图像 和测试数据集(test dataset)中的1000张图像组成。 因此,训练集和测试集分别包含60000和10000张图像。 测试数据集不会用于训练,只用于评估模型性能。

李沐-动手学深度学习-图像分类数据集_第2张图片

 每个输入图像的高度和宽度均为28像素。 数据集由灰度图像组成,其通道数为1。

两个可视化数据集的函数。Fashion-MNIST中包含的10个类别,分别为t-shirt(T恤)、trouser(裤子)、pullover(套衫)、dress(连衣裙)、coat(外套)、sandal(凉鞋)、shirt(衬衫)、sneaker(运动鞋)、bag(包)和ankle boot(短靴)。 以下函数用于在数字标签索引及其文本名称之间进行转换。

李沐-动手学深度学习-图像分类数据集_第3张图片

几个样本的图像及其相应的标签

李沐-动手学深度学习-图像分类数据集_第4张图片

 读取小批量数据,大小为batch_size。为了使我们在读取训练集和测试集时更容易,我们使用内置的数据迭代器,而不是从零开始创建。 回顾一下,在每次迭代中,数据加载器每次都会读取一小批量数据,大小为batch_size。 通过内置数据迭代器,我们可以随机打乱了所有样本,从而无偏见地读取小批量。

李沐-动手学深度学习-图像分类数据集_第5张图片

定义load_data_fashion_mnist函数用于获取和读取Fashion-MNIST数据集。 这个函数返回训练集和验证集的数据迭代器。 此外,这个函数还接受一个可选参数resize,用来将图像大小调整为另一种形状。 李沐-动手学深度学习-图像分类数据集_第6张图片

 

你可能感兴趣的:(深度学习,分类,机器学习)