sscanf的高级用法

printf或者sprintf一定是任何一个C程序员最常见到的函数,与sprintf的作用相反,sscanf通常被用来解析并转换字符串,其格式定义灵活多变,可以实现很强大的字符串解析功能。

 

sscanf的原型很简单,定义如下:

#include <stdio.h>
int sscanf(const char *str, const char *format, ...);

str:待解析的字符串

format:字符串格式描述,其后是一序列数目不定的指针参数,存储解析后的数据

 

下面是一个简单的例子:

int year, month, day;

int converted = sscanf("20080808", "%04d%02d%02d", &year, &month, &day);

printf("converted=%d, year=%d, month=%d, day=%d/n", converted, year, month, day);

输出结果:

converted=3, year=2008, month=8, day=8

 

"%04d%02d%02d"是用来解析字符串的格式,%表示格式转换的开始,d表示转换为一个整数,04作为d的修饰,表示这是一个长度为4位的整数,不足4位时以0补齐。

例子返回结果等于3,表示有3个数据成功转换,转换成功数目同时取决于被解析的字符串以及其转换格式,如果我们把例子中的格式改为"%04d%02d",那么sscanf将只返回2,day的数值不会被sscanf更改。

 

这是一个浮点数转换的例子:

double longitude, latitude;
int converted = sscanf("113.123456789 31.123456789", "%lf %lf", &longitude, &latitude);
printf("converted=%d, longitude=%.9lf, latitude=%lf/n", converted, longitude, latitude);

输出结果:

converted=2, longitude=113.123456789, latitude=31.123457

sscanf的格式字符串中,f表示这是一个浮点数,其修饰词l表示这是一个double的浮点数。

 

上面是两个关于sscanf基本的例子,下面我们来演示sscanf的高级用法:

char str[32] = "";
sscanf("123456abcdedf", "%31[0-9]", str);
printf("str=%s/n", str);

输出结果:

str=123456

上面的格式中,[0-9]表示这是一个仅包含0-9这几个字符的字符串,前面使用数字31修饰词表示这个字符串缓冲区的最大长度(这也是sscanf最为人诟病的地方,很容易出现缓冲区溢出错误,实际上sscanf是可以避免出现缓冲区溢出的,只要在书写任何字符串解析的格式时,注意加上其缓冲区尺寸的限制)。

 

又一个例子:

char str[32] = "";
sscanf("123456abcdedf", "%31[0-9a-z]", str);
printf("str=%s/n", str);

输出结果:

str=123456abcdedf

在格式[]中增加了a-z的描述。

 

使用^的例子:

char str[32] = "";
sscanf("123456abcdedf", "%31[^a-z]", str);
printf("str=%s/n", str);

输出结果:

str=123456

在[]中增加^表示相反的意思,上面的[^a-z]表示一个不包含任何a-z之间的字符串。

 

使用*的例子:

char str[32] = "";
int ret = sscanf("123456abcdedf", "%*[0-9]%31[a-z]", str);
printf("ret=%d, str=%s/n",ret, str);

输出结果:

ret=1, str=abcdedf

加上*修饰表示一个被忽略的数据,同时也不需要为它准备空间存放解析结果。如上面的例子中,我们就只使用了str一个参数存放%31[a-z]的解析结果,而sscanf也只返回1,表示只解析了一个数据。

 

掌握了[], ^, *如何使用后,我们会发现sscanf原来是一个如此强大的工具,很多我们原先认为必须使用正则表达式的地方,很可能使用sscanf就可以实现。

 

 

下面是format的一些参考资料:

 

转换类型:

%d:整数,需要一个类型为int*的的参数存放转换结果

%i:整数,如果字符串以0x或者0X开头,则按16进制进行转换,如果以0开头,则按8进制进行转换,否则按10进制转换,需要一个类型为int*的的参数存放转换结果

%o:无符号的8进制数,需要一个类型为unsigned int*的参数存放转换结果

%u:无符号的整数,需要一个类型为unsigned int*的参数存放转换结果

%x:无符号的16进制数,需要一个类型为unsigned int*的参数存放转换结果

%X:等同于%x

%f:浮点数,需要一个类型为float*的参数存放转换结果

 

%c:单个字符,需要一个类型为char*的参数存放转换结果

%s:以空格或者换行符结尾的字符串,需要一个类型为char*的参数存放转换结果

%[]:仅包含在[]中的字符的字符串,如[0-9]表示一个全部是数字的字符串,[a-z]表示一个全部为小写字母的字符串,需要一个类型为char*的参数存放转换结果

%[^]:与上面相反,[^之后,]之前的所有字符都作为字符串结束标志,如[^0-9]表示一个不包含任何0-9的字符串,需要一个类型为char*的参数存放转换结果

 

转换类型修饰符:

*:忽略标志,如%*d表示忽略一个整数,%*s表示忽略一个字符串

h:short修饰符,如%hd表示这是一个short int的整数

l:long修饰符,如%ld表示这是一个long int的整数, %lf表示这是一个double的浮点数(%f表示一个float的浮点数)

L: <GCC> long long修饰符,如%Ld表示这是一个64位字节的整数, %Lf表示这是一个long double的浮点数

I64: <VisualC++> __int64修饰符,如%I64d表示这是一个64位字节的整数

你可能感兴趣的:(c,正则表达式,存储,工具,float)