C语言——字符串+内存函数及其模拟实现

目录

    • 0. 思维导图
    • 1. 前言
    • 2. 函数介绍
      • 2.1 strlen
      • 2.2 strcpy
      • 2.3 strcat
      • 2.4 strcmp
      • 2.5 strncpy
      • 2.6 strncat
      • 2.7 strncmp
      • 2.8 strstr
      • 2.9 strtok
      • 2.10 strerror
      • 2.11 memcpy
      • 2.12 memmove
      • 2.13 memcmp
      • 2.14 memset
    • 3. 库函数模拟实现
      • 3.1 模拟实现strlen
      • 3.2 模拟实现strcpy
      • 3.3 模拟实现strcat
      • 3.4 模拟实现strcmp
      • 3.5 模拟实现strstr
      • 3.6 模拟实现memcpy
      • 3.7 模拟实现memmove
    • 4. 结语

0. 思维导图

C语言——字符串+内存函数及其模拟实现_第1张图片

1. 前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。
字符串常量适用于那些对它不做修改的字符串函数。

2. 函数介绍

2.1 strlen

strlen参数及返回类型:
size_t strlen ( const char * str );

  • 字符串已经 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。
  • 参数指向的字符串必须以 ‘\0’ 结束。
  • 函数返回类型为size_t,是无符号。

用法示例:

//求字符串长度
int main()
{
	const char* str1 = "abcdef";
	const char* str2 = "bbb";
	if (strlen(str2) - strlen(str1) > 0)
	{

		printf("str2>str1\n");
	}
	else
	{
		printf("srt1>str2\n");
	}
	return 0;
}

在这里,需注意strlen的返回类型是size_t,如果将if判断条件里的str1和str2交换位置,那么会出现什么样的结果呢?
C语言——字符串+内存函数及其模拟实现_第2张图片

2.2 strcpy

strcpy参数及返回类型:
char * strcpy ( char * destination, const char * source );

  • 源字符串必须以 ‘\0’ 结束。
  • 会将源字符串中的 ‘\0’ 拷贝到目标空间
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变(常量字符串不可作为目标参数)。

用法示例:

//拷贝字符串
int main()
{
	char arr1[20] = { 0 };
	char* p = "abcdefghjiklmn";
	char arr2[] = "hello world";
	//strcpy(p,arr2)//err p为常量字符串
	strcpy(arr1, arr2);
	printf("%s", arr1);
	return 0;
}

2.3 strcat

strcat参数及返回类型:
char * strcat ( char * destination, const char * source );

  • 源字符串必须以 ‘\0’ 结束。
  • 目标空间足够大,能容纳下源字符串的内容。
  • 目标空间必须可修改。

用法示例:

//追加字符串
int main()
{
	char arr[20] = "hello ";
	strcat(arr,"RMB");
	printf("%s", arr);
	return 0;
}

C语言——字符串+内存函数及其模拟实现_第3张图片

那么strcat能不能自己给自己追加字符串呢?
答案是:不能。
原因:2个指针共同在操作一个数组,源字符串的’\0’处一直在被追加字符,那么就没有结束标志,会进入死循环。
C语言——字符串+内存函数及其模拟实现_第4张图片

2.4 strcmp

strcmp参数及返回类型:
int strcmp ( const char * str1, const char * str2 );

  • 标准规定:
    第一个字符串大于第二个字符串,则返回大于0的数字
    第一个字符串等于第二个字符串,则返回0
    第一个字符串小于第二个字符串,则返回小于0的数字

用法示例:

//比较字符串
int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "abf";
	printf("%d",strcmp(arr1, arr2));
	return 0;
}

这里是一个字符一个字符进行比较,实际上是对应位置上的ASCII码值。
C语言——字符串+内存函数及其模拟实现_第5张图片

2.5 strncpy

strncpy函数参数及返回类型:
char * strncpy ( char * destination, const char * source, size_t num );

  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

用法示例:

//拷贝字符串(指定长度)
int main()
{
	char arr[20] = { 0 };
	printf("%s", strncpy(arr, "abcdef",3));
	return 0;
}

小贴士:
1、这里指定了拷贝长度,不会再添加’\0’进去
C语言——字符串+内存函数及其模拟实现_第6张图片
2、如果指定长度超出了拷贝的字符串长度,那么多超出的部分会补’\0’
C语言——字符串+内存函数及其模拟实现_第7张图片

2.6 strncat

strncat函数参数及返回类型:
char * strncat ( char * destination, const char * source, size_t num );

  • 将源文件的第一个num字符附加到目标文件,加上一个终止空字符(‘\0’)。
  • 如果source中C字符串的长度小于num,则只复制到结束空字符的内容。

用法示例:

//追加字符串(指定长度)
int main()
{
	char arr[20] = "abc";
	strncat(arr, "qweasd", 3);
	printf("%s\n", arr);
	return 0;
}

2.7 strncmp

strncmp函数参数及返回类型:
int strncmp ( const char * str1, const char * str2, size_t num );

  • 比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。

用法示例:

//比较字符串(指定长度)
int main()
{
	char* p1 = "abcdef";
	char* p2 = "abcefgh";
	int ret1 = strncmp(p1, p2, 4);
	int ret2 = strncmp(p1, p2, 3);
	printf("%d\n", ret1);
	printf("%d\n", ret2);
	return 0;
}

2.8 strstr

strstr函数参数及返回类型:
const char * strstr ( const char * str1, const char * str2 );
          ~~~~~~~~~          char * strstr ( char * str1, const char * str2 );

  • 返回str2在str1中第一次出现的指针,如果str2不是str1的一部分,则返回空指针。

用法示例:

//字符串查找
int main()
{
	char arr1[] = "abcdRMB";
	char arr2[] = "dRM";
	char* ret = strstr(arr1, arr2);
	if (ret == NULL)
	{
		printf("Not Found\n");
	}
	else
	{
		printf("%s", ret);
	}
	return 0;
}

2.9 strtok

strtok函数参数及返回类型:
char * strtok ( char * str, const char * delimiters );

  • sep参数是个字符串,定义了用作分隔符的字符集合。
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改)。
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

用法示例:

int main()
{
	char arr[] = "[email protected]";
	char* p = "@.";
	char buf[20] = { 0 };
	strcpy(buf, arr);
	char* ret = NULL;
	for (ret = strtok(buf, p); ret != NULL; ret = strtok(NULL, p))
	{
		printf("%s\n", ret);
	}
	return 0;
}

C语言——字符串+内存函数及其模拟实现_第8张图片

2.10 strerror

strerror函数参数及返回类型:
char * strerror ( int errnum );

  • C语言的库函数在运行的时候,如果发生错误,就会将错误码存放在一个变量中,这个变量是errno;
    但是错误码是一些数字:1、2、3、4…
    strerror函数即是返回错误码,所对应的错误信息。

用法示例:

//报告错误信息
int main()
{
	printf("%s\n", strerror(1));
	printf("%s\n", strerror(2));
	printf("%s\n", strerror(3));
	printf("%s\n", strerror(4));
	//读文件操作
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
		return 1;
	}
	fclose(pf);
	pf = NULL;
	return 0;
}

字符分类函数:

函数 如果他的参数符号下列条件就返回真
iscntrl 任何控制字符
isspace 空白字符:空格‘ ’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’
isdigit 十进制数字 0~9
isxdigit 十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A ~ F
islower 小写字母a~z
isupper 大写字母A~Z
isalpha 字母a ~ z或A ~ Z
isalnum 字母或者数字,a ~ z,A ~ Z,0~9
ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符

字符转换:

函数 功能
tolower 转换成小写字母
toupper 转换成大写字母

这些C语言有许多库函数,我们可用工具进行查找我们想了解的函数,cplusplus这个网站内容丰富,感兴趣的可以点击浏览。

2.11 memcpy

上面讲的函数,都是操作字符类型的,有一定的局限性,所以出现了一些可操作内存的函数。

memcpy函数参数及返回类型:
void * memcpy ( void * destination, const void * source, size_t num );、

  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
  • 这个函数在遇到 ‘\0’ 的时候并不会停下来。
  • 如果source和destination有任何的重叠,复制的结果都是未定义的。

用法示例:

int main()
{
	int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
	int arr2[10] = { 0 };
	int arr3[10] = { 0 };
	memcpy(arr2, arr1, 20);//从下标0开始拷贝
	memcpy(arr2, arr1 + 2, 20);//从下标2开始拷贝
	return 0;
}
  • memcpy函数是有一定的局限性的,未提供内存的覆盖检测和处理。
  • 虽然目前C语言库里面已经将memcpy的检测功能实现,但作为程序员,还是需要更谨慎一点,如果内存重叠,我们用memmove就行了。

2.12 memmove

memmove函数参数及返回类型:
void * memmove ( void * destination, const void * source, size_t num );

  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。

用法示例:

int main()
{
	//char* p = "abcdef";
	char arr1[] = "csdn.RMB";
	char arr2[] = "abcdefg";
	memmove(arr1, arr1 + 2, 3);
	memmove(arr2 + 2, arr2, 3);
	printf("%s\n",arr1);
	printf("%s\n", arr2);
	return 0;
}

2.13 memcmp

memcmp函数参数及返回类型:
int memcmp ( const void * ptr1, const void * ptr2, size_t num );

  • 比较从ptr1和ptr2指针开始的num个字节。

用法示例:

int main()
{
	int arr1[] = { 1,2,3,4 };
	int arr2[] = { 1,2,5,4 };
	char str1[] = "abcde";
	char str2[] = "abcde";
	int ret1 = memcmp(arr1, arr2,12);
	int ret2 = memcmp(str1, str2, 3);
	printf("%d\n", ret1);;
	printf("%d\n", ret2);;
	return 0;
}

2.14 memset

memset函数参数及返回类型:
void * memset ( void * ptr, int value, size_t num );

  • 字节为单位设置内存中的数据。

用法示例:

int main()
{
	char arr[] = "hello RMB";
	memset(arr, '6', 5);
	printf(arr);
	return 0;
}

小贴士:
这里因为是一个字节一个字节来修改的,那么对于整型的修改,就会不是那么尽意。
如图:将每一个字节都修改成1。C语言——字符串+内存函数及其模拟实现_第9张图片

3. 库函数模拟实现

3.1 模拟实现strlen

贴士:
因为考虑到我们的实用性,将返回类型设置为int类型,如果强制要求按正规的,可设置为size_t类型。

方法1:

//计数器
int my_strlen(const char* str)
{
	assert(str != NULL);
	int count = 0;
	while (*str != '\0')
	{
		count++;
		str++;
	}
	return count;
}

方法2:

//递归实现
int my_strlen(const char* str)
{
	assert(str != NULL);
	if (*str != '\0')
	{
		return 1 + my_strlen(str + 1);
	}
	else
		return 0;
}

方法3:

//指针-指针
int my_strlen(const char* str)
{
	assert(str != NULL);
	const char* start = str;
	while (*str)
	{
		str++;
	}
	return str - start;
}

3.2 模拟实现strcpy

char* my_strcpy(char*dest,const char*src)
{
	assert(dest != NULL && src != NULL);
	char* ret = dest;
	while (*dest++ = *src++)
	{
		;
	}
	return ret;
}

3.3 模拟实现strcat

char* my_strcat(char* dest, const char* src)
{
	assert(dest != NULL && src != NULL);	
	char* ret = dest;
	//找目标空间的\0
	while (*dest != '\0')
	{
		dest++;
	}
	//追加字符串
	while (*dest++ = *src++)
	{
		;
	}
	return ret;
}

3.4 模拟实现strcmp

int my_strcmp(const char*str1,const char* str2)
{
	assert(str1 != NULL && str2 != NULL);
	while (*str1==*str2)
	{
		if (*str1 == '\0')
		{
			return 0;
		}
		str1++;
		str2++;
	}
	return *str1 - *str2;
}

3.5 模拟实现strstr

const char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 != NULL && str2 != NULL);
	if (*str2 == '\0')
	{
		return str1;
	}
	const char* s1 = NULL;
	const char* s2 = NULL;
	const char* cp = str1;
	while (*cp)
	{
		s1 = cp;
		s2 = str2;
		while (*s1 != '\0' && *s2 != '\0' && *s1 == *s2)
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			return (char*)cp;//定义的返回值是const char* ,我们强制类型换成char*类型
		}
		cp++;
	}
	return NULL;
}

当然了,这样匹配是有点繁琐,属于暴力求解。关于字符串的匹配,有一种KMP算法,之前博主写过KMP算法的讲解文字,有兴趣可点击链接了解:KMP算法。

3.6 模拟实现memcpy

void* my_memcpy(void* dest, const void* src,size_t num)
{
	assert(dest != NULL && src != NULL);
	void* ret = dest;
	while (num--)
	{
		//这里我们并不知道传递过来的内容是什么类型
		//统一强制类型转换成 char*类型
		//这样就可以一个字节一个字节的拷贝
		*(char*)dest = *(char*)src;
		dest = (char*)dest + 1;
		src = (char*)src + 1;
	}
	return ret;
}

3.7 模拟实现memmove

void* my_memmove(void* dest, const void* src,size_t num)
{
	assert(dest != NULL && src != NULL);
	void* ret = dest;
	if (dest < src)
	{
		//从前往后拷贝
		while (num--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else
	{
		//从后向前拷贝
		while (num--)
		{
			*((char*)dest + num) = *((char*)src + num);
		}
	}
	return ret;
}

C语言——字符串+内存函数及其模拟实现_第10张图片

4. 结语

   ~~   本篇文章将大多数常用的字符及字符串操作函数以进行说明讲解,其他的如果同志们有兴趣可以借助工具进行学习(MSDN、cpulsplus)。
   ~~   那么本期的分析就到这里,有帮助的话,希望大家好三连支持一下,蟹蟹,再见咯。

你可能感兴趣的:(C语言,原创,c语言)