sscanf和正则表达式

sscanf() - 从一个字符串中读进与指定格式相符的数据.
      函数原型:
  Int sscanf( string str, string fmt, mixed var1, mixed var2 ... );
  int scanf( const char *format [,argument]... );

  说明:
  sscanf与scanf类似,都是用于输入的,只是后者以屏幕(stdin)为输入源,前者以固定字符串为输入源。
  其中的format可以是一个或多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '/t' | '/n' | 非%符号}
  注:
  1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)
  2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
  3、width表示读取宽度。
  4、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。
  5、type :这就很多了,就是%s,%d之类。
  6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值
  支持集合操作:
  %[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)
  %[aB'] 匹配a、B、'中一员,贪婪性
  %[^a] 匹配非a的任意字符,贪婪性

例子:
  1. 常见用法。
  char buf[512] ={0} ;
  sscanf("123456 ", "%s", buf);
  printf("%s/n", buf);
  结果为:123456
  2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。
  sscanf("123456 ", "%4s", buf);
  printf("%s/n", buf);
  结果为:1234
  3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。
  sscanf("123456 abcdedf", "%[^  ]", buf);
  printf("%s/n", buf);
  结果为:123456
  4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。
  sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf);
  printf("%s/n", buf);
  结果为:123456abcdedf
  5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。
  sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf);
  printf("%s/n", buf);
  结果为:123456abcdedf
  6、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中
  sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
  printf("%s/n", buf);
  结果为:12DDWDFF
   
   
  sscanf是一个运行时函数,原形很简单:
  int sscanf(const char *buffer,const char *format [,argument ] ...);
  它强大的功能体现在对format的支持上。
  我以前用它来分隔类似这样的字符串2006:03:18:
  int a, b, c;
  sscanf("2006:03:18", "%d:%d:%d", a, b, c);
  
       2006:03:18 - 2006:04:18:
  char sztime1[16] = "", sztime2[16] = "";
  sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2);
   
       2006:03:18-2006:04:18

    sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2);



 
定义函数
 int sscanf (const char *str,const char * format,........); 
函数说明 
sscanf()会将参数str的字符串根据参数format字符串来转换并格式化数据。格式转换形式请参考scanf()。转换后的结果存于对应的参数内。 
返回值 
成功则返回参数数目,失败则返回-1,错误原因存于errno中。 返回0表示失败 否则,表示正确格式化数据的个数 例如:sscanf(str,"%d%d%s", &i,&i2, &s); 如果三个变成都读入成功会返回3。 如果只读入了第一个整数到i则会返回1。证明无法从str读入第二个整数。 

 
 
int i; 
unsigned int j; 
char input[ ]=”10 0x1b aaaaaaaa bbbbbbbb”; 
char s[5]; 
sscanf(input,”%d %x %5[a-z] %*s %f”,&i,&j,s,s); 
printf(“%d %d %s ”,i,j,s); 
 
执行 10 27 aaaaa 


sscanf(stringBuf.c_str(), "%20[^#]#%20[^ ]",......)语句中""中的内容含义为: 
“%[ ]”符号用于声明字符串,它比“%s”更具体,可以用于设置读取的样式。例如“%[a-z]”只读取小写字母,读到其它字符就结束。注意,方括号中如果有“^”,代表一直读到某字符为止。例如: “%[^#]”:读取字符串,一直到出现“#”号为止。 “%20[^#]”:读取20个字节的字符串,出现“#”号时结束。 所以,“%20[^#]#%20[^ ]”的意义就是, 读取两个20字节大小的字符串,第一个字符串可以用#结束,第二个字符串可以用回车符结束。 
 

1. 常见用法。 
 
charstr[512]={0};
sscanf("123456","%s",str);
printf("str=%s",str); 
2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。 
 
sscanf("123456","%4s",str);
printf("str=%s",str); 
3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。 
 sscanf("123456abcdedf","%[^ ]",str);
printf("str=%s",str); 
4. 取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。 
 
sscanf("123456abcdedfBCDEF","%[1-9a-z]",str);
printf("str=%s",str); 
5. 取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。 
sscanf("123456abcdedfBCDEF","%[^A-Z]",str);
printf("str=%s",str); 

 

名称: sscanf() - 从一个字符串中读进与指定格式相符的数据. 
语法: int sscanf( string str, string fmt, mixed var1, mixed var2 ... ); 
整数 sscanf( 字符串 str, 字符串 fmt, 混合 var1, 混合 var2 ... ); 
用法: 以指定的格式 fmt 去解读字符串 str. fmt 中除了 %d 和 %s 以外, 亦可包含其他的字符串作为格式. 每一个 %d 或 %s 都对应一个参数, 按顺序为 var1, var2 ... %d 读入一个整数到参数中, 而 %s 读入一个字符串. * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)  sscanf() 会返回符合格式的 %d 和 %s 总数. 

例子: 
float price;
int quantity;
char category[21], name[21];
char vendor[21], sku[21];
char buf[201]; 
fp = fopen(filename, "r");
fgets(buf, 200, fp);
sscanf(buf,"%20[^#]#%20[^#]#%f#%i#%20[^#]#%20[^/n]",name, sku, &price, &quantity, category, vendor); 

下面简单做些解说: 
%20[^#]# 最多读入20个字符,直到遇见定界符#,但不包含定界符
%f# 读入一个浮点数,直到遇见定界符#
%i# 读入一个整数,直到遇见定界符#
%20[^/n] 最多读入20个字符,忽略行尾的回车符 


 

表头文件 #include(stdio.h)<stdio.h>
定义函数 int sscanf (const char *str,const char * format,........);
函数说明 sscanf()会将参数str的字符串根据参数format字符串来转换并格式化数据。格式转换形式请参考scanf()。转换后的结果存于对应的参数内。
返回值 成功则返回参数数目,失败则返回-1,错误原因存于errno中。 
 

%[ ] 的用法:%[ ]表示要读入一个字符集合, 如果[ 后面第一个字符是”^”,则表示反意思。[ ]内的字符串可以是1或更多字符组成。空字符集(%[])是违反规定的,可导致不可预知的结果。%[^]也是违反规定的。

%[a-z] 读取在 a-z 之间的字符串,如果不在此之前则停止,如
char s[]="hello, my friend” ; // 注意: ,逗号在不 a-z之间
sscanf( s, “%[a-z]”, string ) ; // string=hello
%[^a-z] 读取不在 a-z 之间的字符串,如果碰到a-z之间的字符则停止,如
char s[]="HELLOkitty” ; // 注意: ,逗号在不 a-z之间
sscanf( s, “%[^a-z]”, string ) ; // string=HELLO
%*[^=] 前面带 * 号表示不保存变量。跳过符合条件的字符串。
char s[]="notepad=1.0.0.1001" ;
char szfilename [32] = "" ;
int i = sscanf( s, "%*[^=]", szfilename ) ; 
// szfilename=NULL,因为没保存
int i = sscanf( s, "%*[^=]=%s", szfilename ) ; 
// szfilename=1.0.0.1001
%40c 读取40个字符
%[^=] 读取字符串直到碰到’=’号,’^’后面可以带更多字符,如:
char s[]="notepad=1.0.0.1001" ;
char szfilename [32] = "" ;
int i = sscanf( s, "%[^=]", szfilename ) ; 
// szfilename=notepad 
如果参数格式是:%[^=:] ,那么也可以从 notepad:1.0.0.1001读取notepad

你可能感兴趣的:(sscanf和正则表达式)