C语言字符串格式化处理(转)

C语言 字符串格式化处理(转)
一直以来对于C语言处理字符串有一种误解,总觉得很麻烦。对于习惯了java中string各种封装操作的我来说,要习惯C中处理

复杂的字符串还真不是一件易事。

最近开始喜欢上这个函数 sscanf.

int sscanf(constchar*buffer,   constchar*format [,   argument ] ... );

在stdlib中,scanf和printf有好多版本:

fscanf和fprintf是分别从流中格式化输入输出的。

scanf和fprintf是从标准设备中格式化输入输出的。

sscanf和sprintf则是向字符缓冲区中格式化输入输出的。

这些函数除了重定向的源和目的不同外,最为核心和强大的都是format的支持。

下面以sscanf为例,小结一下各个参数的强大功能。

一、常见格式说明符:

%d

十进制整数.

%o

八进制整数   0.

%x

十六进制整数 0x.

%D


一个十进制整数,如果以0开始,则为八进制,如果以0x开始,则为十六进制.

%f


浮点数.


%c

单个字符.

%s


一个字符串。如果%s后面跟一个%d,则%s只会匹配所有非数字的字符. 如果后面跟一个%[],则%s会匹配所有的没有在%[]中出现的字符. 如果后面跟普通字符串text,则%s会匹配所有的字符,直到text的第一次出现.


%Ns

如上,匹配一个长度为N的字符串.

%[characters]


一个字符串包含任意characters列表中的字符.

一个减号可以用来表示范围。例如%[a-d]表示包含任意a、b、c的字符串(前闭后开的区间).

一个 ^ 符号表示否定、去除的意思。例如%[^abc]表示除了a,b,c的任意字符.

这些符号可以组合使用.


%{format%}


尽可能多地重复匹配这个格式,匹配结果是一个数组的数组。例如%{%d%} 匹配0个或多个整数.


%%

表示一个百分号%字符.类似于转义字符.

如果有星号(*)被放到了百分号%和格式说明符之间,如%*d, 则函数只会匹配这个格式说明符,会忽略第一个匹配说明符之前的字符。

sscanf函数返回成功匹配的字符占所有字符的百分比的一个整数(范围从0到100).

如果一个匹配不成功,那么sscanf会立即返回,没有成功匹配的参数值不会改变。

二、实例

1、网上流传很广的周星星(具体是谁,我也不知道,姑且这么称呼)的一段代码

#include  
int main() 

const char* s = "iios/12DDWDFF@122"; 
char buf[20]; 
sscanf( s, "%*[^/]/%[^@]", buf );

printf( "%s\n", buf ); 
return 0; 

结果为:12DDWDFF

其中

%*[^/],匹配了从开始到第一个'/'字符字符出现以前的字符串,由于有'*',则将这部分忽略掉。

/,匹配该反斜杠'/'

%[^@],匹配到第一个'@'之前的所有字符串,即12DDWDFF

2、最近正在做的一个类似编译后端的程序中的一个例子。

要解析诸如 mov A,R0之类的汇编指令序列

#include  
int main() 
{

char* line ="MOV A,@R0\n";

char temp[2][10];

sscanf( line, "%*[^ ] %[^,]", temp[0] );       //操作数 A

sscanf( line, "%*[^,],%[^\n]", temp[1] );      //操作数 @R0

return 0;

}

本例中temp[0]匹配了A,temp[1]匹配了@R0

sscanf( line, "%*[^ ] %[^,]", temp[0] );

首先根据%*[^ ],可以忽略前面的"MOV",接着是一个空格,最后匹配到’,‘为止。

sscanf( line, "%*[^,],%[^\n]", temp[1] );     //操作数 @R0

首先根据%*[^,],匹配并忽略','之前的所以字符,然后再匹配直到行末尾。


你可能感兴趣的:(c/c++/vc++)