✨ 猪巴戒:个人主页✨
所属专栏:《C语言进阶》
跟着猪巴戒,一起学习C语言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。
常量字符串适用于那些对它不做修改的字符串函数。
目录
前言
字符分类函数
函数介绍
strlen
正常情况下的strlen的使用
在没有' \0 '的情况下
(易错)strlen的返回值是无符号类型
学会strlen函数的模拟实现
1.计数器方法
2.指针-指针方法
3.递归方法
strcpy
正常情况下:
源字符串必须以 '\0' 结束
⽬标空间必须⾜够⼤,以确保能存放源字符串
⽬标空间必须可修改
strcpy的模拟实现
strcat
正常使用
strcat的模拟实现
strcmp
介绍
strcpy的模拟实现
长度受限函数
strncpy
strncpy的使用
源字符串的⻓度⼩于num
strncpy的模拟实现
strncat
strncat的使用
strncmp
strstr
strstr的使用
strstr的模拟实现
strtok
strerror
strerror的使用
C语言中有一系列的函数是专门做字符分类,也就是一个字符是属于什么类型的字符的。
这些函数的使用都需要包含一个头文件ctype.h
函数 | 如果它的参数符合下列条件就返回真 |
iscntrl | 任何控制字符 |
isspace | 空白字符:空格‘ ’,换页‘\f’,换行‘\n’,回车‘\r’,制表符‘\t’,或者垂直制表符‘\v’ |
isdigit | 十进制数字‘0’~‘9’字符 |
isxdigit | 十六进制数字,包括所有十进制数字字符,小写字母a~f,大写字母A~F |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 字母a~z或A~Z |
isalnum | 字母或者数字,a~z,A~Z,0~9 |
ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
size_t strlen( const char* str );
#include
#include
int main()
{
char arr[] = "abcdef";//abcdef\0
int len = strlen(arr);
printf("%d\n", len);
return 0;
}
返回结果为6。一共是六个字符。
#include
#include
int main()
{
char arr[] = { 'a','b','c' };
int len = strlen(arr);
printf("%d\n", len);
return 0;
}
这里返回的就是一个随机值,因为没有' \0 '函数就会一直查找下去,直到遇到内存中的' \0 '才会停止 ,所以这里返回的是随机值。
#include
#include
int main()
{
if (strlen("abc") - strlen("abcdef"))
{
printf(">\n");
}
else
{
printf("<\n");
}
return 0;
}
对strlen的返回类型不了解容易产生错误
由于strlen返回的是无符号类型,所以无符号类型的变量相减,得到的也是无符号类型,不会有负数
#include
#include
int main()
{
if (strlen("abc") - strlen("abcdef"))
{
printf(">\n");
}
else
{
printf("<\n");
}
return 0;
}
学会strlen的模拟实现,可以让我们进一步地了解strlen 的内部结构,也能让我们掌握编写函数的能力。
当我们在编写函数的时候,都要想到3种方法,
1.计数器方法
2.指针-指针方法
3.递归方法
1.计数器方法
#include
#include
#include
size_t my_strlen(const char* str)
{
size_t count = 0;
assert(str);
while (*str != '\0')
{
count++;
str++;
}
return count;
}
int main()
{
char arr[] = "abcdef";
size_t n = my_strlen(arr);
printf("%u\n", n);
return 0;
}
2.指针-指针方法
这里是指针-指针的方法,通过指针-指针的方法同样可以实现strlen函数。
但是这里要注意:指针-指针,我们要用高地址的指针来减低地址的指针,不然就会返回负数,无符号类型没有负数就会返回一个较大的数,这里容易产生错误
#include
#include
#include
size_t my_strlen(const char* str)
{
char* tmp = str;
assert(str);
while (*str != '\0')
{
str++;
}
return (str-tmp);
}
int main()
{
char arr[] = "abcdef";
size_t n = my_strlen(arr);
printf("%u\n", n);
return 0;
}
3.递归方法
递归就是直接或者间接地调用自身,把一个大型复杂的程序简化为规模较小的程序,将大量的程序用简单的程序来代替。
递归的主旨是将大事化小。
#include
#include
#include
size_t my_strlen(const char* str)
{
char count = 0;
assert(str);
if (*str == '\0')
return 0;
else
{
count++;
str++;
}
return (count + my_strlen(str));
}
int main()
{
char arr[] = "abcdef";
size_t n = my_strlen(arr);
printf("%u\n", n);
return 0;
}
字符串拷贝
把source空间的字符串传给destination空间里去。
char* strcpy( char* destination, const char* source )
#include
#include
int main()
{
char name[20] = { 0 };
strcpy(name,"zhangsan");
printf("%s\n", name);
return 0;
}
这里的arr数组并没有这个‘ \0 ’就会导致不相干的其他内容被拷贝到数组中,并且会有数组越界。
#include
#include
int main()
{
char name[20] = "xxxxxxxx";
char arr[] = { 'a','b','c' };
strcpy(name, arr);
printf("%s\n", name);
return 0;
}
如果空间不够大,将大内存的内容存放到这个空间,系统就会崩溃,还会产生越界访问。
#include
#include
int main()
{
char name[3] = "";
char arr[] = "abcdef";
strcpy(name, arr);
printf("%s\n", name);
return 0;
}
这里的“abcdef”是常量字符串,不可以修改,强行修改的话,就会产生访问冲突。
#include
#include
int main()
{
char* p = "abcdef";
char arr[] = "abc";
strcpy(p, arr);
return 0;
}
strcpy的实现原理就是,
将字符串一一对应地从source移到dest上去。
source,dest表示的是字符数组,C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。
由于是数组,source ,dest表示的都是数组名,就是首元素的地址,source表示的就是 ' a '.
我们要把source搬到dest上,*dest = *source,就是将第一个元素搬过去
然后就是source++,dest++,逐个地将每一个元素都搬运过去。
assert,断言,作用是防止传过来的参数是空指针。
#include
char* my_strcpy(char* dest, const char* source)
{
assert(dest && source);
char* start = dest;
while (*source != '\0')
{
*dest = *source;
dest++;
source++;
}
*dest = *source;
return start; //strcpy的返回值是目标字符串,所以要将原来的dest的位置记下来
}
int main()
{
char arr1[] = "abcdef";
char arr2[20] = { 0 };
my_strcpy(arr2, arr1);
printf("%s\n", arr2);
return 0;
}
字符串追加,当我们想要在原有的字符串后面追加字符串。
char * strcat ( char * destination, const char * source )
#include
#include
int main()
{
char arr1[20] = "hello ";
strcat(arr1, "world");
printf("%s\n", arr1);
return 0;
}
strcat的实现原理,
就是现在dest找到' \0 ',然后从' \0 ' 开始将需要追加的字符串加到后面。
1.找到dest 的' \0 ' ,如果dest不是' \0 ' ,那就dest++;
2.直到找到我们的' \0 '.拷贝字符串。
#include
char* my_strcat(char* dest, const char* source)
{
assert(dest && source);
char* start = dest;
//1.找到dest的' \0 '
while (*dest != '\0')
{
dest++;
}
//2.拷贝字符串
while (*dest++ = *source++)
{
;
}
return start;
}
int main()
{
char arr1[20] = "hello ";
strcat(arr1, "world");
printf("%s\n", arr1);
return 0;
}
比较字符串
int strcmp ( const char * str1, const char * str2 )
strcmp是一位一位通过ASCII码值进行比较的,如果是下面两个字符数组比较,就是
第一位一样,第二位一样
第三位arr2的q比arr1的c大,
那么arr2就比arr1大
#include
int main()
{
char arr1[20] = "abc";
char arr2[] = "abcd";
int num = strcmp(arr1, arr2);
if (num < 0)
{
printf("<\n");
}
else if(num = 0)
{
printf("=\n");
}
else
{
printf(">\n");
}
return 0;
}
strcpy的实现原理
通过ASCII码值进行一一比较,如果arr1,arr2的元素相同的话,就进行下一位的比较。
直到遇到不一样的元素进行比较,直接返回它们的差就可以了。
#include
#include
#include
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);
while (*str1 == *str2)
{
str1++;
str2++;
}
return *str1 - *str2;
}
int main()
{
char arr1[20] = "abc";
char arr2[] = "abcd";
int num = my_strcmp(arr1, arr2);
if (num < 0)
{
printf("<\n");
}
else if(num = 0)
{
printf("=\n");
}
else
{
printf(">\n");
}
return 0;
}
char * strncpy ( char * destination, const char * source, size_t num );
#include
#include
int main()
{
char arr1[20] = "abcdef";
char arr2[] = "hello world";
strncpy(arr1, arr2, 5);
printf("%s\n", arr1);
return 0;
}
#include
#include
int main()
{
char arr1[20] = "abcdef";
char arr2[] = "bit";
strncpy(arr1, arr2, 5);
printf("%s\n", arr1);
return 0;
}
和strcpy不同的是,strncpy有长度的限制,原来的while循环,加上num--的限制条件。
如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。
char* my_strncpy(char* dest, const char* source, size_t num)
{
assert(dest && source);
char* start = dest;
while (num && *source)
{
num--;
*dest++ = *source++;
}
while(num != 0)
{
*dest = '\0';
dest++;
num--;
}
return start;
}
char * strncpy ( char * destination, const char * source, size_t num )
#include
#include
int main()
{
char str1[20];
char str2[20];
strcpy(str1, "To be ");
strcpy(str2, "or not to be");
strncat(str1, str2, 6);
printf("%s\n", str1);
return 0;
}
int strncmp ( const char * str1, const char * str2, size_t num )
⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不⼀样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0.
char * strstr ( const char * str1, const char * str2 )
- 函数返回字符串str2在字符串str1中第⼀次出现的位置
- 字符 串的⽐较匹配不包含 \0 字符,以 \0 作为结束标志
如果存在子串的内容,就会返回子串在字符串中的位置。
#include
#include
int main()
{
char email[] = "[email protected]";
char substr[] = "bitejiuyeke";
char* ret = strstr(email, substr);
if (ret == NULL)
{
printf("子串不存在\n");
}
else
{
printf("%s\n", ret);
}
return 0;
}
char* my_strstr(const char* str1, const char* str2)
{
char* cp = (char*)str1;
char* s1, * s2;
if (!*str2)
return((char*)str1);
while (*cp)
{
s1 = cp;
s2 = (char*)str2;
while (*s1 && *s2 && !(*s1 - *s2))
s1++, s2++;
if (!*s2)
return(cp);
cp++;
}
return(NULL);
}
char * strtok ( char * str, const char * delimiters )
如果ret为空指针,strtok就会返回空指针。
#include
#include
int main()
{
const char* sep = "@.";
char email[] = "[email protected]";
char* ret = strtok(email, sep);
printf("%s\n", email);
ret = strtok(NULL, sep);
printf("%s\n", ret);
ret = strtok(NULL, sep);
printf("%s\n", ret);
ret = strtok(NULL, sep);
printf("%s\n", ret);
return 0;
}
这样就可以不需要知道email有多少个分割符。
#include
#include
int main()
{
const char* sep = "@.";
char email[] = "[email protected]";
char* ret = NULL;
for (ret = strtok(email, sep); ret != NULL; ret = strtok(NULL, sep))
{
printf("%s\n", ret);
}
return 0;
}
char * strerror ( int errnum )
#include
#include
#include
int main()
{
int i = 0;
for (i = 0; i <= 10; i++)
{
printf("%s\n", strerror(i));
}
return 0;
}
有了strerror,我们就可以明确地知道错误信息是什么。
#include
#include
#include
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 1;
}
else
//
return 0;
}