参照http://blog.sina.com.cn/s/blog_68afa6190101ewb7.html和http://yann.lecun.com/exdb/mnist/index.html进行操作,仍然遇到一点儿低级错误问题,当时在网上看到也有人跟我有相同问题,却找不到答案,因此把自己的经历记录下来,以便有跟我有同样遭遇的同学参考。
第一步:下载MNIST数据集
下载链接为:
http://yann.lecun.com/exdb/mnist/index.html
直接点击网页中以下四个红色字体的文件可以下载。
文中描述please note that your browser may uncompress these files without telling you. If the files you downloaded have a larger size than the above, they have been uncompressed by your browser. Simply rename them to remove the .gz extension.
看到最后一句,我以为直接重命名文件把后缀.gz去掉就可以,而不是用解压缩的方式。。。结果折腾了半天就是读不出来。。
正确做法是:下载后解压缩文件!!
第二步:获取图片
刚才下载的文件即使解压缩后也不是我们通常意义上能够读取的图片文件,所以得借助MATLAB或Python进行解析读取。
以下为Matlab程序。
代码部分转自http://blog.sina.com.cn/s/blog_68afa6190101ewb7.html,并在其基础上修改了一点儿(不修改的话,有错运行不出来)
% Matlab_Read_t10k-images_idx3.m
% 用于读取MNIST数据集中t10k-images.idx3-ubyte文件并将其转换成bmp格式图片输出。
% 用法:运行程序,会弹出选择测试图片数据文件t10k-labels.idx1-ubyte路径的对话框和
% 选择保存测试图片路径的对话框,选择路径后程序自动运行完毕,期间进度条会显示处理进度。
% 图片以TestImage_00001.bmp~TestImage_10000.bmp的格式保存在指定路径,10000个文件占用空间39M。。
% 整个程序运行过程需几分钟时间。
% Written By DXY@HUST IPRAI
% 2009-2-22
clear all;
clc;
%读取训练图片数据文件
[FileName,PathName] = uigetfile('*.*','选择测试图片数据文件t10k-images.idx3-ubyte');
TrainFile = fullfile(PathName,FileName);
fid = fopen(TrainFile,'r'); %fopen()是最核心的函数,导入文件,‘r’代表读入
a = fread(fid,16,'uint8'); %这里需要说明的是,包的前十六位是说明信息,从上面提到的那个网页可以看到具体那一位代表什么意义。所以a变量提取出这些信息,并记录下来,方便后面的建立矩阵等动作。
MagicNum = ((a(1)*256+a(2))*256+a(3))*256+a(4);
ImageNum = ((a(5)*256+a(6))*256+a(7))*256+a(8);
ImageRow = ((a(9)*256+a(10))*256+a(11))*256+a(12);
ImageCol = ((a(13)*256+a(14))*256+a(15))*256+a(16);
%从上面提到的网页可以理解这四句
if ((MagicNum~=2051)||(ImageNum~=10000))
error('不是 MNIST t10k-images.idx3-ubyte 文件!');
fclose(fid);
return;
end %排除选择错误的文件。
savedirectory = uigetdir('','选择测试图片路径:');
h_w = waitbar(0,'请稍候,处理中>>');
for i=1:ImageNum
b = fread(fid,ImageRow*ImageCol,'uint8'); %fread()也是核心的函数之一,b记录下了一副图的数据串。注意这里还是个串,是看不出任何端倪的。
c = reshape(b,[ImageRow ImageCol]); %亮点来了,reshape重新构成矩阵,终于把串转化过来了。众所周知图片就是矩阵,这里reshape出来的灰度矩阵就是该手写数字的矩阵了。
d = c'; %转置一下,因为c的数字是横着的。。。
e = 255-d; %根据灰度理论,0是黑色,255是白色,为了弄成白底黑字就加入了e
e = uint8(e);
savepath = fullfile(savedirectory,['TestImage_' num2str(i,d) '.bmp']);
imwrite(e,savepath,'bmp'); %最后用imwrite写出图片
waitbar(i/ImageNum);
end
fclose(fid);
close(h_w);
首先说怎么在第一步中说直接重命名通过不了
会报错:不是 MNIST t10k-images.idx3-ubyte 文件!
然后说代码链接中的错误:
savepath = fullfile(savedirectory,['TestImage_' num2str(i,'d') '.bmp']);
会有错误提示d的类型不对。应该修正为:
savepath = fullfile(savedirectory,['TestImage_' num2str(i,d) '.bmp']);
通过以上步骤就可以得到MNIST数据集中bmp格式的图片了