动手学深度学习PyTorch版--大作业--Fashion-mnist分类任务

代码有点长,故放github上了
文件预处理 – 数据准备 – 训练/测试–打印csv表
需要的同学请自取【我的github】
Fashion-mnist
经典的MNIST数据集包含了大量的手写数字。十几年来,来自机器学习、机器视觉、人工智能、深度学习领域的研究员们把这个数据集作为衡量算法的基准之一。你会在很多的会议,期刊的论文中发现这个数据集的身影。实际上,MNIST数据集已经成为算法作者的必测的数据集之一。有人曾调侃道:“如果一个算法在MNIST不work, 那么它就根本没法用;而如果它在MNIST上work, 它在其他数据上也可能不work!”

Fashion-MNIST的目的是要成为MNIST数据集的一个直接替代品。作为算法作者,你不需要修改任何的代码,就可以直接使用这个数据集。Fashion-MNIST的图片大小,训练、测试样本数及类别数与经典MNIST完全相同

这个数据集的样子大致如下(每个类别占三行):
类别标注
在Fashion-mnist数据集中,每个训练样本都按照以下类别进行了标注:
动手学深度学习PyTorch版--大作业--Fashion-mnist分类任务_第1张图片

1.任务描述

Fashion-MNIST是一个替代MNIST手写数字集的图像数据集。 它是由Zalando(一家德国的时尚科技公司)旗下的研究部门提供。其涵盖了来自10种类别的共7万个不同商品的正面图片。Fashion-MNIST的大小、格式和训练集/测试集划分与原始的MNIST完全一致。60000/10000的训练测试数据划分,28x28的灰度图片。你可以直接用它来测试你的机器学习和深度学习算法性能,且不需要改动任何的代码。

本次任务需要针对Fashion-MNIST数据集,设计、搭建、训练机器学习模型,能够尽可能准确地分辨出测试数据地标签。

2.文档说明

数据集文件分为训练集和测试集部分,对应文件如下:

  • 训练数据:train-images-idx3-ubyte.gz
  • 训练标签:train-labels-idx1-ubyte.gz
  • 测试数据:t10k-images-idx3-ubyte.gz
  • 测试标签:t10k-labels-idx1-ubyte.gz

3.评估说明

评价指标
本次任务采用 ACC(Accuracy) 作为模型的评价标准。

在线评估
评估函数首先会验证选手提交的预测结果文件是否符合要求,主要验证了以下要求:

提交的预测文件是否存在重复ID
提交的预测文件ID是否与测试集文件ID不匹配
通过验证后的文件会用以ACC为测评指标的函数进行计算评估。

文件格式
由于测评脚本已经统一,为保证脚本的顺利运行,在进行测评时,要求选手提交的预测文件拥有规范的字段名和字段格式,预测文件具体要求如下:
动手学深度学习PyTorch版--大作业--Fashion-mnist分类任务_第2张图片
基准算法
本次任务采用不同的基准算法,获得模型的ACC如下:

  • 随机基准算法ACC:0.09440
  • 弱基准算法ACC:0.90452
    在评估时,以弱基准算法的ACC作为达标线。

4.参考文献

[1] Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms. Han Xiao, Kashif Rasul, Roland Vollgraf. arXiv:1708.07747
[2] https://github.com/zalandoresearch/fashion-mnist/

你可能感兴趣的:(动手学深度学习,-,Pytorch版,深度学习,计算机视觉)