3.字符和字符串
在MATLAB中,几个字符(Character)可以构一个字符串(String)。一个字符串被视为一个行向量,而字符串中的每一个字符(含空格符),则是以其ASCII的形式存放于此向量的每一个元素中,只是它的外显形式仍然是可读的字符。字符串类型在数据的可视化、应用程序的交互方面有着非常重要的作用。
3.1 创建字符串
1.一般字符串的创建
在MATLAB中,所有的字符串都用两个单引号括起来,进行输入赋值。如在MATLAB命令窗口中输入:
>> a='matlab'
a =
matlab
字符串的每个字符(空格也是字符)都是相应矩阵的一个元素,上述变量a是1×6阶的矩阵,可以用size(a)命令查得:
>> size(a)
ans =
1 6 % 1行6列
2.中文字符串的创建
中文也可以作为字符串的内容。但需要注意的是:在中文字符串的输入过程中,两边的单引号必须是英文状态的单引号。例如:
>> A='中文字符串输入演示'
A =
中文字符串输入演示
3.字符串的寻访
在MATLAB中,字符串的寻访可以通过其坐标来实现。在一个字符串中,MATLAB按照从左至右的顺序对字符串中的字符依次编号(1,2,3,…)。进行字符串的寻访,只需要像寻访一般矩阵那样即可。例如在前面创建了中文字符串A之后可以得到:
>> A(3:5)
ans =
字符串
4.字符串数组的创建
二维字符串(数组)的建立也非常简单。可以像数值数组的建立那样直接输入,也可以使用str2mat等函数建立。
【例3-6】 多行串数组的直接输入示例。
>> clear
>> S=['This string array '
'has multiple rows.']
S =
This string array
has multiple rows.
>> size(S)
ans =
2 18
需要注意的是:在直接输入多行字符串数组的时候,每一行的字符个数必须相同。
【例3-7】 使用函数str2mat创建多行串数组示例。
>> a=str2mat('这','字符','串数组','','由5 行组成')
a =
这
字符
串数组
由5 行组成
>> size(a)
ans =
5 6
在使用函数str2mat创建字符串数组的时候,不用担心每一行的字符个数是否相等,函数在运行中会以字符最多的一行为准,而将其他行中的字符以空格补齐。
3.2 字符串比较
在MATLAB中,有多种对字符串进行比较的功能:
(1)比较两个字符串或者子串是否相等;
(2)比较字符串中的单个字符是否相等;
(3)对字符串内的元素分类,判断每个元素是否是字符或者空格。
用户可以使用下面4个函数中的任意一个,来判断两个输入字符串是否相等。
(1)strcmp:判断两个字符串是否相等。
(2)strncmp:判断两个字符串的前n个字符是否相等。
(3)strcmpi和strncmpi:这两个函数的作用分别与strcmp和strncmp相同,只是在比较的过程中忽略了字母大小写。
考虑有这两个字符串:
>>str1 = 'hello';
>>str2 = 'help';
字符串str1和str2并不相等,所以使用strcmp函数来判断的话,将会返回逻辑0(false)。例如:
>>C = strcmp(str1,str2)
C =
0
由于字符串str1和str2的前3个字符相等,所以用strncmp函数来比较前3个以内字符,将会返回逻辑1(true)。例如:
>>C = strncmp(str1, str2, 2) % 比较前两个字符
C =
1
下面介绍如何对大小写不同的情况进行比较。
>> str3 = 'Hello';
>> D = strncmp(str1, str3,2) % 对大小写敏感
D =
0
>> F = strncmpi(str1, str3,2) % 对大小写不敏感
F =
1
用户可以使用关系运算符进行字符串的比较,只要比较的数组具有相同的尺寸,或者其中一个是标量即可。例如,可以使用(==)运算符来判断两个字符串中有哪些字符相等。
>>A = 'fate';
>>B = 'cake';
>>A == B
ans =
0 1 0 1
所有的关系运算符都可以用来比较字符串相对应位置上的字符。
3.3 字符串查找与替换
MATLAB提供了很多函数供用户进行字符串的查找与替换。更加强大的是,MATLAB也支持在字符串的查找与替换中使用正则表达式。通过灵活使用正则表达式,可以对字符串进行各种形式的查找与替换。至于正则表达式的应用,用户可以查询帮助文档中的Regular Expressions部分。
【例3-8】 使用strrep函数进行字符串查找替换示例。
考虑有这样一个标签:
>> label = 'Sample 1, 03/28/15'
label =
Sample 1, 03/28/15
函数strrep用于实现一般的查找与替换功能。本例中使用strrep函数,将日期从"03/28"替换为"03/30"。命令如下:
>> newlabel = strrep(label, '28', '30')
newlabel =
Sample 1, 03/30/15
【例3-9】 使用findstr函数进行字符串查找示例。
findstr函数用于返回某一子串在整个字符串中的开始位置。例如在字符串中查找字母a和oo出现的位置,可以使用如下命令:
>> strtemp='have a good time!'
strtemp =
have a good time!
>> position1= findstr('a', strtemp)
position1 =
2 6
>> position2 = findstr('oo', strtemp)
position2 =
9
从本例可以看出,字母a出现在第2和第6两个位置,这说明findstr函数返回的位置信息包括所有出现的子串的位置。而字母'oo'字串只出现了一次,所以只返回一个位置信息。
strtok 函数用于返回分隔字符第1次出现之前的字符。如果不自行指定分隔字符,默认的分隔字符则是泛空格符字符,因此用户可以使用strtok函数将一个句子按照单词分开。
【例3-10】 使用strtok函数进行字符串查找示例。
>> t='I have walked out on a handful ofmovies in my life.'; % 测试字符串
>> remain = t;
>> while true %使用while循环结构
[str, remain] = strtok(remain); % 以默认的空格为分隔符查找
if isempty(str), break; end % 循环跳出控制
disp(sprintf('%s', str)) % 显示结果
end
以下就是使用strtok函数进行多次查找得到的结果:
I
have
walked
out
on
a
handful
of
movies
in
my
life.
函数strmatch用于查找一个字符数组中以指定子串开始的字符串,该函数返回的是以指定子串开始的行编号。
【例3-11】 使用strmatch函数进行字符串查找示例。
>> maxstrings = strvcat('max', 'minimax','maximum') % 测试字符串数组
maxstrings =
max
minimax
maximum
>> strmatch('max', maxstrings) % 在测试字符串数组中查找以max开头的字符串
ans =
1
3
在本例中第二行minimax虽然也包含max子串,但是这个子串的并不是以max开始的,所以在查找过程中没有返回第2行为结果。
3.4 类型转换
在MATLAB中允许不同类型的数据和字符串类型的数据之间进行转换,这种转换需要使用不同的函数完成。另外,同样的数据,特别是整数数据,有很多种表示的格式,例如十进制、二进制或者十六进制。在C语言中,需要使用printf函数通过相应的格式字符串就可以输出不同格式的数据。而在MATLAB中,则直接提供了相应的函数可以完成数制的转换。表3-2和表3-3分别列举了这些函数。
表3-2 数字与字符串之间的转换函数
函 数说 明函 数说 明
num2str将数字转换为字符串str2num将字符串转换为数字
int2str将整数转换为字符串sprintf格式化输出数据到命令行窗口
mat2str将矩阵转换为eval函数可以使用的字符串sscanf读取格式化字符串
str2double将字符串转换为双精度类型的数据
表3-3 不同数值之间的转换函数
函 数说 明函 数说 明
hex2num将十六进制整数字符串转换为双精度数据dec2bin将十进制整数转换为二进制整数字符串
hex2dec将十六进制整数字符串转换为十进制数据base2dec将指定数制类型的数字字符串转换为十进制整数
dec2hex将十进制数据转换为十六进制整数字符串dec2base将十进制整数转换为指定数制类型的数字字符串
bin2dec将二进制整数字符串转换为十进制整数
在表3-2列举的数字与字符串之间的转换函数中,常用的是num2str和str2num。这两个函数在MATLAB的图形用户界面编程中应用较多。
【例3-12】 num2str和str2num函数用法实例。
>> a=['1 2';'3 4'] % 创建一个字符串数组
a =
1 2
3 4
>> b=str2num(a) % 将字符串转换为数值形式
b =
1 2
3 4
>> c=str2num('1+2i') %将字符串转换为数值形式
c =
1.0000 +2.0000i
>> d=str2num('1 +2i') %将字符串转换为数值形式
d =
1.0000 +0.0000i 0.0000 + 2.0000i>>e=num2str(rand(3,3),6) % 将数值转换为字符串形式
e =
0.814724 0.913376 0.278498
0.905792 0.632359 0.546882
0.126987 0.0975404 0.957507
>> whos
Name Size Bytes Class Attributes
a 2x3 12 char
b 2x2 32 double
c 1x1 16 double complex
d 1x2 32 double complex
e 3x35 210 char
本例中转换生成变量c和d时得到了不同的结果,主要原因是在变量d中,数字 “1”和字符“+2i”之间存在空格,而加号“+”和数字“2”之间没有空格,所以转换的结果与生成变量c时不同,创建变量c的时候,在数字“1”、加号“+”和数字“2”之间都存在空格。为了避免出现上述问题,可以使用str2double函数,但是该函数仅能转换标量,不能转换矩阵或者数组。
使用num2str函数将数字转换为字符串时,可以指定字符串所表示的有效数字位数,详细信息可以查阅MATLAB的help文档。
3.5 字符串应用函数小结
MATLAB主要以矩阵计算闻名于世,除此以外该软件在字符串处理方面也提供了一系列非常强大的函数。表3-4对常用字符串函数进行了分类小结。
表3-4 字符串函数
函 数说 明
字符串创建函数'str'由单引号(英文状态)创建字符串
blanks创建空格字符串
sprintf将格式化数据写入字符串
strcat字符串组合
strvcat竖直方向字符串组合
字符串修改函数deblank删除尾部空格
lower将所有字符小写
sort将所有元素升序或降序排列
strjust字符串对齐
strrep字符串替换
strtrim删除开始和尾部的泛空格符
upper将所有字符大写
字符串的读取和操作eval将一个字符串作为MATLAB命令执行
sscanf格式读入字符串
续表
函 数说 明
字符串查找替换函数findstr查找子串
strcmp字符串比较
strcmpi字符串比较,忽略大小写
strmatch查找符合要求的行
strncmp比较字符串的前N个字符
strncmpi比较字符串的前N个字符,忽略大小写
strtok查找某个字符最先出现的位置