string.h是一个C标准库头文件,包含了字符串处理函数、字符分类函数、数值转换函数、内存管理函数等操作字符串的函数。
查询:string.h头文件
size_t strlen ( const char * str );
例如:
#define _CRT_SECURE_NO_WARNINGS 1
#include
#include
int main()
{
char arr1[] = { "abcdef" };
//正确,自动添加'\0'
printf("%d\n", strlen(arr1));
char arr2[] = { 'a','b','c','d' };
//错误,需要手动添加'\0',否则输出随机值
printf("%d\n", strlen(arr2));
char arr3[] = { 'a','b','c','d','\0' };
//正确
printf("%d\n", strlen(arr3));
return 0;
}
#define _CRT_SECURE_NO_WARNINGS 1
#include
#include
int main()
{
if (strlen("abc") - strlen("abcdef") > 0)
{
printf(">=\n");
}
else
{
printf("<\n");
}
return 0;
}
原因:strlen返回的类型是size_t,也就是无符号整型,无符号整型-无符号整型得到的还是无符号整型,也就是说,它们相减得到的值并不是-3,而应该是:
ps:
1.%zu打印size_t类型;
2.不要将strlen与sizeof混淆,strlen返回字符串长度,sizeof返回数组元素个数。
#define _CRT_SECURE_NO_WARNINGS
#include
#include
//第一种:创建变量
size_t my_strlen1(const char* b)
{
assert(b);//断言函数,提高代码安全性(空指针报错)
size_t count = 0;
while (*b++ != '\0')
{
count++;
}
return count;
}
//第二种,不创建变量
size_t my_strlen2(const char* b)
{
assert(b);
if (*b == '\0')
return 0;
else
return 1 + my_strlen2(b + 1);
}
int main()
{
char a[] = "bit is yyds.";
printf("%zu\n", my_strlen1(a));
printf("%zu\n", my_strlen2(a));
return 0;
}
char* strcpy(char * destination, const char * source );
注意事项:
源字符串必须以 ‘\0’ 结束(必须要有‘\0’);
目标空间必须足够大,以确保能存放源字符串(目标空间要比源字符串空间大);
目标空间必须可变(不能是常量字符串);
eg.
char* p="abcdef"; char arr[]="zxy"; strcpy(p,arr);
会报错
了解了strcpy如何使用,我们再来试试模拟实现;
前面已经说过,strcpy函数会将‘\0’也复制到目标空间,那么我们就可以认为,strcpy将源函数从起始位置复制到’\0’结束,而复制本身就是覆盖的过程,上代码
#define _CRT_SECURE_NO_WARNINGS
#include
#include
char* my_strcpy(char* a, const char* b)
{
char* m = a;//保存起始地址
assert(a && b);
while (*a++ = *b++)//当b把‘\0’赋给a时,循环结束
{
;
}
return m;
}
int main()
{
char arr1[] = "bit is yyds!";
char arr2[20];
printf("%s", my_strcpy(arr2, arr1));
return 0;
}
char * strcat ( char * destination, const char * source );
注意事项:
strcat怎样模拟?既然是追加,自然要从目标字符串的‘\0’位置开始。代码如下:
#define _CRT_SECURE_NO_WARNINGS
#include
#include
char* my_strcat(char* str1, const char* str2)
{
char* m = str1;
assert(str1 && str2);
//str1指向目标字符串的'\0'
while (*str1)
{
str1++;
}
//追加
while (*str1++ = *str2++)
{
;
}
return m;
}
int main()
{
char arr1[20] = { "bit " };
char arr2[] = { "is yyds!" };
printf("%s", my_strcat(arr1, arr2));
return 0;
}
int strcmp ( const char * str1, const char * str2 );
功能:比较字符串
标准规定:
str1大于第str2,则返回大于0的数字
str1等于str2,则返回0
str1小于str2,则返回小于0的数字
总结:返回值大于0则前面大,小于0则前面小
一个误区:
一些初学者认为,哪一个字符串长哪一个就大(大错特错!)
字符串大小并不是由长度来判断,而是根据字符的ASCII值判断,从两个字符串的第一个字符开始,前面的大就返回大于0的数字,前面的小就返回小于0的数字,相等就比较下一个字符。
如果两个字符串相等,则比较到’\0’停止。
例:
#define _CRT_SECURE_NO_WARNINGS 1
#include
#include
int main()
{
char str1[] = "abcde";
char str2[] = "abcdE";
if (strcmp(str1, str2) > 0)
printf("str1>str2\n");
else if (strcmp(str1, str2) > 0)
printf("str1);
else
printf("str1=str2\n");
}
一个一个比较即可
#define _CRT_SECURE_NO_WARNINGS
#include
#include
int my_strcmp(char* a, const char* b)
{
assert(a && b);
//如果相等,是'\0'就返回0,不是就接着往后比
//如果不相等就结束循环
while (*a == *b)
{
if (*a == '\0')
return 0;
a++;
b++;
}
return *a - *b;//不相等时的返回值
}
int main()
{
char arr1[20] = { "bit is yyds." };
char arr2[] = { "bit is yyds!" };
printf("%d\n", my_strcmp(arr1, arr2));
return 0;
}
刚刚讲的strcpy、strcat、strcmp都是长度不受限制的字符串函数,现在来讲讲长度受限制的字符串函数。
顾名思义,与之前讲的函数相比,接下来讲的几个函数的功能与前面的完全相同,只不过多了一个参数来限制,这大大提高了代码的安全性,避免了越界问题。
char * strncpy ( char * destination, const char * source, size_t num );
注意点:
其他方面与strcpy完全相同,在此就不一一赘述。
#define _CRT_SECURE_NO_WARNINGS
#include
#include
char* my_strncpy(char* a, const char* b, size_t num)
{
char* m = a;
assert(a && b);
int i = 0;
while ((*a++ = *b++) && ++i < num)//遇到\0或达到num个停止
{
;
}
//如果上面的循环是‘\0'结束的,i就没有加一,所以下面的循环用++i把上面循环里的第'\0'的个数补上
//所以下面的循环理解上是先赋值再i+1,不是i先加1再赋值
while (++i < num)//如果未达到num个,补0
{
*a++ = '\0';
}
return m;
}
int main()
{
char arr1[] = "bit is yyds!";
char arr2[20];
printf("%s", my_strncpy(arr2, arr1, 20));
return 0;
}
char * strncat ( char * destination, const char * source, size_t num );
注意点:
大致思路同strncpy
#define _CRT_SECURE_NO_WARNINGS
#include
#include
char* my_strncat(char* str1, const char* str2, size_t num)
{
char* m = str1;
assert(str1 && str2);
while (*str1)
{
str1++;
}
int i = 0;
while ((*str1++ = *str2++) && ++i < num)
{
;
}
while (++i < num)
{
*str1++ = '\0';
}
return m;
}
int main()
{
char arr1[20] = { "bit " };
char arr2[] = { "is yyds!" };
printf("%s", my_strncat(arr1, arr2,12));
return 0;
}
int strncmp ( const char * str1, const char * str2, size_t num );
#include
#include
int main ()
{
char str[][5] = { "R2D2" , "C3PO" , "R2A6" };
int n;
puts ("Looking for R2 astromech droids...");
for (n=0 ; n<3 ; n++)
if (strncmp (str[n],"R2xx",2) == 0)
{
printf ("found %s\n",str[n]);
}
return 0;
}
char * strstr ( const char *str1, const char * str2);
/* strstr example */
#include
#include
int main()
{
char str[] = "This is a simple string";
char* pch;
pch = strstr(str, "simple");//“simple”中字符‘s’的地址
if (pch != NULL)
{
strncpy(pch, "sample", 6);
}
puts(str);
return 0;
}
s1和s2判断字符串是否相等,cp保存目标字符串中的每个元素的地址
#define _CRT_SECURE_NO_WARNINGS
#include
#include
char* my_strstr(const char* str1, const char* str2)
{
char* s1 = NULL;//
char* s2 = NULL;
char* cp = (char*)str1;//把一个相对安全的指针(const修饰)交给不安全的指针,权限放大了,所以强制类型转换
while (*cp)//每一次循环都是重新判断str1中是否存在str2
{
s1 = cp;
s2 = (char*)str2;//同上
while (*s1 && *s2&& *s1 == *s2)*s1或*s2指向‘\0’结束或者字符不相等结束
{
s1++;
s2++;//自增比下一个字符
}
if (*s2 == '\0')//到了‘\0’代表找到了
{
return cp;//返回第一次找到str2的地址
}
cp++;
}
return NULL;//找不到
}
int main()
{
char arr1[] = "gaoshu is very very difficult.";
char arr2[] = "very";
char* p = my_strstr(arr1, arr2);
if (p == NULL)
printf("找不到\n");
else
printf("%s", p);
return 0;
}
之所以将这两个函数放在一块,是因为它们的功能都是查找字符。
const char * strchr ( const char * str, int character );
例:
/* strchr example */
#include
#include
int main ()
{
char str[] = "This is a sample string";
char * pch;
printf ("Looking for the 's' character in \"%s\"...\n",str);
pch=strchr(str,'s');//‘s’第一次出现
while (pch!=NULL)
{
printf ("found at %d\n",pch-str+1);
pch=strchr(pch+1,'s');//往后找‘s’所有出现的位置
}
return 0;
}
const char * strrchr ( const char * str, int character );
/* strrchr example */
#include
#include
int main ()
{
char str[] = "This is a sample string";
char * pch;
pch=strrchr(str,'s');//最后一次
printf ("Last occurence of 's' found at %d \n",pch-str+1);
return 0;
}
模拟较为简单,不做演示。
size_t strspn ( const char * str1, const char * str2 );
/* strspn example */
#include
#include
int main ()
{
int i;
char strtext[] = "129th";
char cset[] = "1234567890";
i = strspn (strtext,cset);
printf ("The initial number has %d digits.\n",i);
return 0;
}
输出:
The initial number has 3 digits.
strtext中,连续3个字符“129”能在cset中找到,故返回3,也是‘t’的下标。
size_t strcspn ( const char * str1, const char * str2 );
用一段代码来解释:
#define _CRT_SECURE_NO_WARNINGS 1
#include
#include
int main()
{
char s[] = "12345Hello, World!";
char letters[] = "abcdefghijklmnopqrstuvwxyz";
size_t num = strcspn(s, letters);
printf("%zu\n", num);
return 0;
}
上述代码中,输出结果为6,因为从s开头到第一个在字母表(letters)中的字符‘e’为止,“12345H”共6个字符不在letters中,故返回值为6,也是‘e’的下标。既然如此,那么,num+1就可以得到s中第一个在字母表中的字符‘e’的位置。
const char * strpbrk ( const char * str1, const char * str2 );
/* strpbrk example */
#include
#include
int main ()
{
char str[] = "This is a sample string";
char key[] = "aeiou";
char * pch;
printf ("Vowels in '%s': ",str);
pch = strpbrk (str, key);//str中找key中的字符
while (pch != NULL)
{
printf ("%c " , *pch);
pch = strpbrk (pch+1,key);
}
printf ("\n");
return 0;
}
输出:
Vowels in ‘This is a sample string’: i i a a e i
char * strtok ( char * str, const char * delimiters );
/* strtok example */
#include
#include
int main ()
{
char str[] ="- This, a sample string.";
char * pch;
printf ("Splitting string \"%s\" into tokens:\n",str);
pch = strtok (str," ,.-");//',''.'-'均为分割符
while (pch != NULL)
{
printf ("%s\n",pch);
pch = strtok (NULL, " ,.-");//重新调用,str设为NULL
}
return 0;
}
输出:
Splitting string “- This, a sample string.” into tokens:
This
a
sample
string
char * strerror ( int errnum );
/* strerror example : error list */
#include
#include
#include
int main ()
{
FILE * pFile;
pFile = fopen ("unexist.ent","r");
if (pFile == NULL)
printf ("Error opening file unexist.ent: %s\n",strerror(errno));
return 0;
}
void * memset ( void * ptr, int value, size_t num );
/* memset example */
#include
#include
int main ()
{
char str[] = "almost every programmer should know memset!";
memset (str,'-',6);
puts (str);
return 0;
}
输出:
------ every programmer should know memset!
void * memcpy ( void * destination, const void * source, size_t num );
#include
#include
void* my_memcpy(void* dest, const void* src, size_t num)
{
void* ret = dest;//保存起始地址
assert(dest && src);
while(num--)
{
*(char*)dest = *(char*)src;//按字节复制,为了保证所有类型都可以,强制转换为最少字节类型char*
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
int main()
{
int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
int arr2[20] = { 0 };
my_memcpy(arr2, arr1, 20);
return 0;
}
void * memmove ( void * destination, const void * source, size_t num );
为什么源空间和目标空间出现重叠用memmove,这是因为在其他函数中,前面已经被覆盖的位置会再次拿来被使用,如下面的代码:
#define _CRT_SECURE_NO_WARNINGS 1
#include
#include
int main()
{
char s[] = "123456789";
memcpy(s + 2, s, 5);
printf("%s", s);
return 0;
}
这里的理想结果应该是“121234589”,但实际上却是“121212189”(当然VS上函数优化过可行,但其他编译器不能保证),因为复制到第三个字符时,已经将第3,4个字符修改为‘1’,‘2’,所以会循环往复。
那改怎么修改呢?
先复制要被改的内容
如果目标位置在起始位置后,就从后往前复制
如果目标位置在起始位置前,就从前往后复制
#define _CRT_SECURE_NO_WARNINGS
#include
#include
void* my_memmove(void* dest, void* src, size_t num)
{
void* ret = dest;
assert(dest && src);
if (dest < src)
{
//前->后拷贝
while (num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else//后->前
{
while (num--)
{
*((char*)dest + num) = *((char*)src + num);
}
}
return ret;
}
int main()
{
int arr1[] = { 1,2,3,4,5,6,7,8,9,10,11,12 };
my_memmove(arr1 + 3, arr1, 20);
for (int i = 0; i < 12; i++)
{
printf("%d ", arr1[i]);
}
return 0;
}
int memcmp ( const void * ptr1, const void * ptr2, size_t num );
/* memcmp example */
#include
#include
int main ()
{
char buffer1[] = "DWgaOtP12df0";
char buffer2[] = "DWGAOTP12DF0";
int n;
n=memcmp ( buffer1, buffer2, sizeof(buffer1) );
if (n>0) printf ("'%s' is greater than '%s'.\n",buffer1,buffer2);
else if (n<0) printf ("'%s' is less than '%s'.\n",buffer1,buffer2);
else printf ("'%s' is the same as '%s'.\n",buffer1,buffer2);
return 0;
}
memcmp模拟根据strncmp仿照memcpy即可。
int strcoll ( const char * str1, const char * str2 );
size_t strxfrm ( char * destination, const char * source, size_t num );
ps:可能有人发现后面没有前面详细了,那是因为实在肝不动了…
感谢支持,欢迎指正