在使用MATLAB的时候,想必各位一定会遇到导入数据的问题。如果需要导入的数据其数据量巨大的话,那么在MATLAB编辑器中将这些数据复制粘贴进来,显然会在编辑器中占据巨大的篇幅,这是不明智的。
一般来说储存这些数据的文件有两种形式:
- txt文件
- excel表格
针对这两种类型的文件,需要使用两个不同的函数。
就导入txt文件来说,个人习惯使用importdata这个函数。
导入txt文件
01 | 导入全是数字类型的txt文件(一)
如果导入的txt文件中,储存的数据全是数字类型的,且同一行的两个数字之间使用空格或者制表符进行分隔。这种形式的txt文件如下所示。
储存这种形式数据的txt文件直接使用如下代码即可。
present01=importdata('present01.txt');
在MATLAB运行之后的结果如下:
02 | 导入全是数字类型的txt文件(二)
如果数据不像刚才给出的数据那么规整,那么就不能继续使用上面的代码了
如果txt文件储存如下的数据:
很明显这个txt文件,第一行只有1,第二行有2和3,第三行有4、5、6和7,第四行有8、9、10和11,第五行有12、13、14和15。
如果我们继续使用上面的代码,看看能否成功导入数据。
present02=importdata('present02.txt');
在MATLAB运行之后结果如下,是一个15行1列的矩阵,这个很明显和我们想要的形式不太一样。
可以发现前两行的数据个数与后三行的数据个数不同,所以在实际导入的时候需要分开导入,这时可以使用如下代码导入present02.txt文件。
filename='present02.txt'; %文件名
delimiterIn = ' '; %列分隔符
headerlinesIn = 2; %读取从第 headerlinesIn+1 行开始的数值数据
present02=importdata(filename,delimiterIn,headerlinesIn);
dataset=present02.data; %导出的3行以后的数据,即3行4列的矩阵
parameters=present02.textdata; %导出的2行以前的数据,即2行1列的元胞数组
- filename是文件名
- delimiterIn是列分隔符,也就是同一行的两个数据之间是如何分隔的,可以是空格,也可以是制表符,也可以是逗号
- headerlinesIn表示读取从第 headerlinesIn+1 行开始的数值数据,因为前两行的数据个数与后三行的数据个数不同,所以这里headerlinesIn = 2,即从读取从第 3行开始的数值数据。
在MATLAB运行之后的结果如下,是一个结构体,其中包括一个3行4列的矩阵data,和一个2行1列的元胞数组textdata。使用变量dataset储存这个3行4列的矩阵,使用parameters储存这个2行1列的元胞数组。
其中这个3行4列的矩阵data就是后三行的数据,这个2行1列的元胞数组textdata就是前两行的数据。
其实在MATLAB中建议不到万不得已的时候尽量不用元胞数组cell,因为元胞数组在处理数据时不方便。但这个txt文件由于每行的数据个数不同,所以我们没有办法将其导入为一个5行4列的矩阵,我们才万不得已将前两行数据导入为元胞数组,后三行数据导入为3行4列的矩阵。
03 | 导入全是数字类型的txt文件(二)拓展
在上述代码中将headerlinesIn设为5,导入的结果
filename='present02.txt'; %文件名
delimiterIn = ' '; %列分隔符
headerlinesIn = 5; %读取从第 headerlinesIn+1 行开始的数值数据
present02=importdata(filename,delimiterIn,headerlinesIn);
在MATLAB运行之后的结果如下,是一个5行1列的元胞数组。
因为一共只有5行数据,而又将headerlinesIn设为5,所以此时读取从第6行开始的数值数据,这句话包含两层意思:1)读取从第6行开始的数值数据,在present02.txt文件中第6行没有数据,所以没有将数据以矩阵的形式导入进来。2)读取第5行之前的非数值数据,然后用元胞数组cell的形式进行储存。
04 | 导入数字和字母混合类型的txt文件
比如说现在导入标准的solomon测试算例,前8行中既有数字又有字母,且每行数据个数不同。
观察发现,第10行以后的数据是一个101行7列的规整的数据。因此,可以将headerlinesIn设为9,具体的代码如下:
filename = 'c101.txt'; %文件名
delimiterIn = ' '; %列分隔符
headerlinesIn =9; %读取从第 headerlinesIn+1 行开始的数值数据
c101=importdata(filename,delimiterIn,headerlinesIn);
row4=c101.textdata{4,1};
len=length(row4);
dataset=c101.data; %导出的10行以后的数据,即101行7列的矩阵
parameters=c101.textdata; %导出的9行以前的数据,即7行1列的元胞数组
在MATLAB运行之后的结果如下:
05 | 导入同一个文件中的多个txt 文件
matlab中给我们提供了dir
这个函数,十分方便。这里是读取所有txt文件,所以是dir('父目录路径\*.txt')
%读取该目录下的所有txt文件
% namelist = dir('C:\Users\Administrator\Desktop\xxx\*.txt');
% 读取后namelist 的属性有
% name -- filename
% date -- modification date
% bytes -- number of bytes allocated to the file
% isdir -- 1 if name is a directory and 0 if not
%通过字符串拼接,获取绝对路径可以直接用[],也可以用strcat()函数
path = 'C:\Users\Administrator\Desktop\xxx\';
namelist = dir([path,'*.txt']);
l = length(namelist);
P = cell(1,l);%定义一个细胞数组,用于存放所有txt文件
for i = 1:l
namelist(i).name;%这里获得的只是该路径下的文件名,如1.txt是相对路径
filename{i} = [path,namelist(i).name];%通过字符串拼接获得的就是绝对路径了
P{1,i} = load(filename{i});
end
面对多个 .txt 文件的依次读入,且文件名按一定的规律命名,如:filename1.txt,filename2.txt,... 。是纯数字数据类型的文本(不掺杂字符类型)依次读入,我们可以将其存储为cell数据类型,以便于后面关于数据的操作。在这里我们举一个例子:假如有10个 .txt 文件,我们把这些数据读入并存储为cell数据类型。我们可以使用循环依次读入文件,Matlab 程序如下:
data = cell(1,10); %建立细胞存储空间
for i = 1:10
g = ['filename' num2str(i) '.txt'];
data(1,i) = {textread(g)};%读入 .txt 文件置于 data 细胞中
end
对于读入的cell数据的显示,我们可以采用 : data{m,n}(p,q); %对存入的cell数据进行显示
在 .txt 文件中掺杂着字母+数字 类型的,我们同样也可以存储为struct 结构体数据的类型。这里我们再举一个列子。比如:两幅带有英文+数字的 .txt文件。我们将其读入并存储为结构体类型。
for i=1:2
str=strcat('filename',num2str(i),'.txt');
hh{1}{i}=importdata(str);
end
对于读入的struct数据的显示,我们可以采用:pp.textdata(2)%数据显示
导入Excel文件
01 | 用xlsread函数读取一个Excel文件
num=xlsread(filename)
filename是单引号括起来的带路径的文件名,函数直接读取filename所指文件的sheet1中的数据区域存储到双精度矩阵num中;其中,数据区域的选取规则是:对表格前几个含有非数值的行(列)直接忽略,不算入数据区域。num = xlsread(filename, -1)
输入后matlab将会打开相应的exel文件,用鼠标选择需要导入的数据区域,可以切换到想要的sheet。num = xlsread(filename, sheet)
其中sheet用来指定读入excel文件的第几个sheet,此时的sheet取值大于1的整数。num = xlsread(filename,sheet, 'range')
其中range指定一个矩形的区域,用单引号括起来;例如:'D2:H4
'代表以D2和H4为对角定点的矩形域;
注意当excel中有合并单元格时,任何一个合并前的单元格的名字(比如D1)都会指代整个合并后的单元格,而将整个单元格读入,所以为了避免麻烦,尽量避免在需要读入的表格中合并单元格。
例如:将读取D盘下的一个文件路径为:D:/test/daxia.xls
num = xlsread('d:/test/daxia.xls',2,'D2:H4')
读取sheet2的D2:H4区域数据
如果要进行交互式的选择用:num= xlsread('d:/test/daxia.xls',-1)
02 | 批量的文件要读取
首先将多个文件进行批量重命名例如daxia1.xls,daxia2.xls,daxia3.xls,...
然后用循环的方式实现:
for i=1:100
filename=['d:/test/daxia',num2str(i),'.xls'];
num=xlsread(filename)
end
资源传送门
- 关注【做一个柔情的程序猿】公众号
- 在【做一个柔情的程序猿】公众号后台回复 【python资料】【2020秋招】 即可获取相应的惊喜哦!
「❤️ 感谢大家」
- 点赞支持下吧,让更多的人也能看到这篇内容(收藏不点赞,都是耍流氓 -_-)
- 欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程