头文件:#include
函数原型:char * strtok (char *str, const char * delimiters);
参数:str:待分割的字符串(c-string);delimiters:分割符字符串。
该函数用来将字符串分割成一个个片段。参数str指向欲分割的字符串,参数delimiters则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delimiters中包涵的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。
需要注意的是,使用该函数进行字符串分割时,会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。第一次分割之后,原字符串str是分割完成之后的第一个字符串,剩余的字符串存储在一个静态变量中,因此多线程同时访问该静态变量时,则会出现错误。
代码举例:
例1:将字符串通过’,’分割开,打印子串并判断原字符串(被分割的字符串)是否发生改变
#include
#include
int main()
{
char str[]="ab,cd,ef";
char *ptr;
printf("before strtok: str=%s\n",str);
printf("begin:\n");
ptr = strtok(str, ",");
while(ptr != NULL){
printf("str=%s\n",str);
printf("ptr=%s\n",ptr);
ptr = strtok(NULL, ",");
}
return 0;
}
输出结果:
before strtok: str=ab,cd,ef
begin:
str=ab
ptr=ab
str=ab
ptr=cd
str=ab
ptr=ef
例2:MSDN例子,字符串中含有多个分隔符
#include
#include
char string[] = "A string\tof ,,tokens\nand some more tokens";//被分割的字符串
char seps[] = " ,\t\n";//分隔符集
char *token;//用指针作为标记
void main( void )
{
printf( "%s\n\nTokens:\n", string );
/* 建立字符串并获取第一个标记(指向子串的首地址) */
token = strtok( string, seps );
while( token != NULL )
{
/* 在“string”中有标记*/
printf( " %s\n", token );
/* 得到下一个标记*/
token = strtok( NULL, seps );
}
}
输出结果:
A string of ,,tokens
and some more tokens
Tokens:
A
string
of
tokens
and
some
more
tokens
结论:strtok在切割字符串的过程,实际上就是将被分割的字符串的分隔字符替换为‘\0’ 并且返回标记字符串的首地址,直到返回NULL结束。
stotok函数的实现原理
函数代码:
#include
#include
//根据函数原型实现strtok()函数
char* myStrtok_origin(char* str_arr,const char* delimiters,char** temp_str)
{
//定义一个指针来指向待分解串
char* b_temp;
/*
* 1、判断参数str_arr是否为空,如果是NULL就以传递进来的temp_str作为起始位置;
* 若不是NULL,则以str为起始位置开始切分。
*/
if(str_arr == NULL)
{
str_arr =*temp_str;
}
//2、跳过待分解字符串
//扫描delimiters字符开始的所有分解符
str_arr += strspn(str_arr, delimiters);//寻找第一个子串,返回子串的长度
//3、判断当前待分解的位置是否为'\0',若是则返回NULL,否则继续
if(*str_arr =='\0')
{
return NULL;
}
/*
* 4、保存当前的待分解串的指针b_temp,调用strpbrk()在b_temp中找分解符,
* 如果找不到,则将temp_str赋值为待分解字符串末尾部'\0'的位置,
* b_temp没有发生变化;若找到则将分解符所在位置赋值为'\0',
* b_temp相当于被截断了,temp_str指向分解符的下一位置。
*/
b_temp = str_arr;
str_arr = strpbrk(str_arr, delimiters);
if(str_arr == NULL)
{
*temp_str = strchr(b_temp,'\0');
}
else
{
*str_arr ='\0';
*temp_str = str_arr +1;
}
//5、函数最后部分无论找没找到分解符,都将b_temp返回。
return b_temp;
}
//使用myStrtok来简化myStrtok_origin函数
char* myStrtok(char* str_arr,const char* delimiters)
{
static char* last;//静态变量
return myStrtok_origin(str_arr, delimiters,&last);
}
int main(void)
{
char buf[]="hello@boy@this@is@heima";
//1、使用myStrtok_origin()函数
char*temp_str = NULL;
char*str = myStrtok_origin(buf,"@",&temp_str);
while(str)
{
printf("%s ",str);
str = myStrtok_origin(NULL,"@",&temp_str);
}
//2、使用myStrtok()函数
char*str1 = myStrtok(buf,"@");
while(str1)
{
printf("%s ",str1);
str1 = myStrtok(NULL,"@");
}
return 0;
}
输出结果:
hello boy this is heima hello
strtok_s是Windows下的一个分割字符串安全函数,其函数原型
char *strtok_s( char *strToken, const char *strDelimit, char **buf);
数将剩余的字符串存储在buf变量中,而不是静态变量中,从而保证了安全性。
代码示例:
例1:使用strtok_s函数分隔字符串
#include
#include
int main()
{
char str[]="ab,cd,ef";
char *ptr;
printf("before strtok: str=%s\n",str);
printf("begin:\n");
char *pTmp = NULL;
ptr = strtok_s(str,",",&pTmp);
while(ptr != NULL)
{
printf("str=%s\n",str);
printf("ptr=%s\n",ptr);
ptr = strtok_s(NULL,",",&pTmp);
}
return 0;
}
输出结果:
before strtok: str=ab,cd,ef
begin:
str=ab
ptr=ab
str=ab
ptr=cd
str=ab
ptr=ef
strtok_s函数是linux下分割字符串的安全函数,函数声明如下:
char *strtok_r(char *str, const char *delim, char **saveptr);
(1)该函数也会破坏带分解字符串的完整性,但是其将剩余的字符串保存在saveptr变量中,保证了安全性。
(2)在函数strtok中剩余字符串是存储在一个静态变量中,因此,多线程在使用该静态变量时引起冲突;而strtok_r则使用用户传入的指针为每个用户saveptr重新申请变量,因而可以保证线程安全。
(3)strtok_r函数是strtok函数的可重入版本,也即线程安全版本。str为要分解的字符串,delim为分隔符字符串。char *saveptr参数是一个指向char 的指针变量,用来在strtok_r内部保存切分时的上下文,以应对连续调用分解相同源字符串。
代码示例:
#include
#include
int main()
{
char str[]="ab,cd,ef";
char *ptr;
char *p;
printf("before strtok: str=%s\n",str);
printf("begin:\n");
ptr = strtok_r(str, ",", &p);
while(ptr != NULL){
printf("str=%s\n",str);
printf("ptr=%s\n",ptr);
ptr = strtok_r(NULL, ",", &p);
}
return 0;
}
拓展:
可重入函数:
(1)重入即表示重复进入,首先它意味着这个函数可以被中断,其次意味着它除了使用自己栈上的变量以外不依赖于任何环境(包括static),这样的函数就是purecode(纯代码)可重入,可以允许有该函数的多个副本在运行,由于它们使用的是分离的栈,所以不会互相干扰。如果确实需要访问全局变量(包括static),一定要注意实施互斥手段。可重入函数在并行运行环境中非常重要,但是一般要为访问全局变量付出一些性能代价。
(2)指一个可以被多个任务调用的函数(过程),任务在调用时不必担心数据是否会出错。
不可重入函数:
如果函数接口的代码实现中在块内定义和使用了static存储类型的变量,这种函数将是不可重入函数。它在实时系统中是不安全函数。
参考:http://blog.csdn.net/jiangqin115/article/details/48545895
http://www.cnblogs.com/Bob-tong/p/6610806.html
http://blog.csdn.net/lavorange/article/details/47134121