Sklearn中的helloworld之MNIST数据集加载问题

如何正确的加载MNIST数据集

MNIST数据集是一组由美国高中生和人口调查局员工手写的70000个数字的图片,每个图片有784个特征,即28*28的像素点。每张图像都用其代表的数字标记。此数据集堪称机器学习领域的“hello world”。

那么我们如何使用该数据集呢?

1、首先需要导入如下包

from sklearn.datasets import fetch_mldata

2、随后在网上下载mnist-original.mat文件,将其放入当前工作目录下的\datasets\mldata中,注意要提前创建文件夹,将该文件放进去。

3、然后写入以下代码

mnist = fetch_mldata('MNIST original',data_home='./datasets')
print(mnist.data.shape)
(70000, 784)

这样MNIST数据集就成功的加载进来啦!!!

你可能感兴趣的:(Sklearn中的helloworld之MNIST数据集加载问题)