【C语言】字符函数和字符串函数(一)—>库函数的介绍与模拟实现

目录

前言:

一、函数介绍:

(一)求字符串长度

(1)strlen

(二)长度不受限制的字符串函数

(2)strcpy

(3)strcat

(4)strcmp

(三)长度受限制的字符串函数

(5)strncpy

(6)strncat

(7)strncmp

(四)字符串查找

(8)strstr

(9)strtok

(五)错误信息报告

(10)strerror

(六)字符操作

(11)字符分类函数

(12)字符转换

(七)内存操作函数

(13)memcpy

(14)memmove

(15)memcmp

(16)memset

二、模拟实现

(一)strlen

(1)计数器

(2)递归

(3)指针-指针

(二)strcpy

(三)strcat

(四)strcmp

(五)strstr

(六)memcpy

(七)memmove


前言:

本篇重点围绕字符和字符串的部分库函数展开讲解,并进行模拟实现,下一篇内容会运用本篇所学进行左旋右旋字符串的判断及实现(三步翻转法)。

一、函数介绍:

(一)求字符串长度

(1)strlen

size_t  strlen( const char* str );

该函数的作用是统计字符串中'\0'之前的字符个数(不含'\0')。

  • 参数指向的字符串必须以'\0'结束
  • 函数的返回值为无符号整型size_t。

利用strlen函数进行字符串长度比较时,要注意得到的结果是无符号整型,所以不能用相减为正负数为依据进行比较。

(二)长度不受限制的字符串函数

长度不受限制的意思是指本分类下的库函数没有设置长度限制,他们都是根据'\0'的位置来自行判断是否停止的,所以'\0'对于此类目下的库函数非常重要,所以你可以发现此类目下的库函数都要求源字符串必须以'\0'结束。

(2)strcpy

char*  strcpy( char* destination, const char* source );

该函数会将source指针指向的字符串拷贝到destination指针指向的字符串中,注意包含'\0'。 

  • 源字符串必须以'\0'结束。
  • 目标空间必须有足够大,确保可以容纳源字符串内容。
  • 目标空间必须可修改。
  • 返回值为目标空间的首元素地址(初始状态下destination的地址)

(3)strcat

char*  strcat( char* destination, const char* source );

该函数会将source指针指向的字符串追加到destination指针指向的字符串后面,注意包含'\0'。

  •  源字符串必须以'\0'结束。
  • 目标空间必须有足够大,确保可以容纳源字符串内容。
  • 目标空间必须可修改。

问:该函数是否可以运用到字符串自己给自己追加的情况?

【C语言】字符函数和字符串函数(一)—>库函数的介绍与模拟实现_第1张图片

当destination指针指向了'\0'时,就做好了追加的准备,下一步就是将'\0'替换为source指向的元素,并依次向后进行,直到检测到source指向'\0'时结束,但当两指针指向同一块区域时,明显source要寻找的'\0'已经被destination修改了,就导致越界出现错误。 

问:那么如何利用库函数使字符串自己给自己追加呢?

我们可以利用另一个库函数strncat就可以解决这一问题,因为strncat是长度受限制的字符串函数,他停止的依据取决于参数num,而不是'\0'的位置

(4)strcmp

int  strcmp( const char* str1, const char* str2 );

 该函数会将两个字符串进行比较,比较的依据是两者第一次出现不同字符的ASCII码值,如果前者大于后者返回一个正数,反之返回一个负数,全部相等返回0。

(三)长度受限制的字符串函数

与长度不受限制的字符串函数的区别在于,该种函数需要设置需要操作的字符个数,也就是参数num,执行结束的依据取决于num,而不取决于'\0'的位置,长度受限制的字符串函数相较于长度不受限制的字符串函数相对更安全

(5)strncpy

char* strncpy( char* destination, const char* source, size_t num );

 该函数的作用是拷贝num个字符从源字符串到目标空间。

  • 如果源字符串长度小于num,则拷贝完源字符串之后,在目标的后面追加'\0',直到num个。

(6)strncat

char* strncat( char* destination, const char* source, size_t num );

 该函数将源字符串num个字符追加到目标字符串后,并加入结束标志'\0'。

  • strncat可以用于字符串自己给自己追加,具体解释见strcat。

(7)strncmp

int  strncmp( const char* str1, const char* str2, size_t num );

该函数的作用是比较到字符不一样或者一个字符串结束或者num个字符全部比较完,前者大于后者返回正数,反之返回负数,全部相等返回0。 

(四)字符串查找

(8)strstr

char* strstr( const char*str1, const char* str2);

该函数的作用是返回str2指向的字符串在str1指向的字符串中第一次出现的位置。 

  • 如果str2指向的字符串不是str1指向的字符串的一部分,那么返回NULL。

(9)strtok

char* strtok( char* str, const char* sep );

该函数用作分割字符串,简单的说就是根据分隔符的字符集合sep分割该字符串。

  • sep参数是个字符串,定义了用作分隔符的字符集合
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。 
  • strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

下面给出一段代码助理解:

假设我们想要得到一个邮箱[email protected]中的去掉符号后的字符串,即mrfanf、csdn、tech,我们就可以利用strtok函数,首先声明分隔符集合“@.”。

#include
#include

int main()
{
	char* p = "[email protected]";
	const char* sep = "@.";
	char arr[30];
	char* str = NULL;
	strcpy(arr, p);//将数据拷贝一份,处理arr数组的内容
	for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
	{
		printf("%s\n", str);
	}
}

(五)错误信息报告

(10)strerror

char* strerror( int errnum );

该函数的作用是返回错误码errnum所对应的错误信息字符串的地址。

  • 库函数在执行时如果发生错误,会将一个错误码存放在errno这个变量中,errno是C语言提供的一个全局变量。
  • 使用该库函数需要额外引用头文件errno.h。

【C语言】字符函数和字符串函数(一)—>库函数的介绍与模拟实现_第2张图片

 应用:

#include

int main()
{
	//C语言中可以操作文件
	//操作文件的步骤
	//1. 打开文件
	//2. 读/写
	//3. 关闭文件

	FILE* pf = fopen("data.txt", "r");//在当前路径下,打开data.txt文件并读取
	if (pf == NULL)//打开或读取失败
	{
		printf("fopen: %s\n", strerror(errno));
		perror("fopen");
		//fopen: xxxxxx
		return 1;
	}
	//读文件
	//...

	//关闭文件
	fclose(pf);

	return 0;
}

perror("fopen");

printf("fopen: %s",strerror(errno)); 

以上代码效果相同(%s前有一个空格字符),perror的作用就是直接打印错误信息,""内为自定义信息,因为错误是默认已经存储的,不需要手动输入,perror自动接收。

(六)字符操作

(11)字符分类函数

函数 如果他的参数符合下列条件就返回真
iscntrl 任何控制字符
isspace 空白字符:空格‘ ’,换页‘\f’,换行'\n',回车‘\r’,制表符'\t'或者垂直制表符'\v'
isdigit 十进制数字 0~9
isxdigit 十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A~F
islower 小写字母a~z
isupper 大写字母A~Z
isalpha 字母a~z或A~Z
isalnum 字母或者数字,a~z,A~Z,0~9
ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符

不可打印字符:ASCII码值为0~31的字符都是不可打印字符。

#include 
int main()
{
	printf("%d\n", isupper('a'));
	printf("%d\n", isdigit('2'));
	return 0;
}

 注:有关字符分类函数和字符转换函数都需要引用头文件ctype.h。

(12)字符转换

int tolower ( int c );转换为小写字符

int toupper ( int c );转换为大写字符

 应用:

#include 
int main()
{
	char arr[20] = { 0 };
	gets(arr);//遇到空格继续读

	char* p = arr;
	while (*p)
	{
		if (isupper(*p))// *p>='A' && *p<='Z'
		{
			*p = tolower(*p);//*p = *p+32;
		}
		p++;
	}
	printf("%s\n", arr);
	return 0;
}

(七)内存操作函数

(13)memcpy

void* memcpy( void* destination, const void* source, size_t num );

该函数从source的位置开始向后复制num个字节的数据到destination的内存位置。

  • 该函数在遇到'\0'的时候并不会停下来。
  • 如果source和destination有任何的重叠,复制的结果都是未定义的,即memcpy是用来处理不重叠的内存拷贝的。

请参考模拟实现部分方便理解。 

(14)memmove

void* memmove( void* destination, const void* source, size_t num );

该函数的功能与memcpy相近,差别在memmove函数处理的源内存块和目标内存块是可以重叠的。

  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理,当然不重叠拷贝也可以使用memmove,在未来应用时,不管两空间重不重叠都是用memmove即可。 

那么为什么memmove可以处理重叠内存的数据呢,请以下图参考模拟实现代码理解:

【C语言】字符函数和字符串函数(一)—>库函数的介绍与模拟实现_第3张图片

(15)memcmp

int memcmp( const void* ptr1, const void* ptr2, size_t num );

该函数作用为比较从ptr1和ptr2指针开始的num个字节,返回值同strncmp。 

(16)memset

void* memset( void* ptr, int value, size_t num);

该函数的作用为将ptr指针开始的num个字节的数据设置为value。 

二、模拟实现

(一)strlen

(1)计数器

//计数器方式
int my_strlen(const char* str)
{
	int count = 0;
	while (*str)
	{
		count++;
		str++;
	}
	return count;
}

(2)递归

//不能创建临时变量计数器
int my_strlen(const char* str)
{
	if (*str == '\0')
		return 0;
	else
		return 1 + my_strlen(str + 1);
}

(3)指针-指针

//指针-指针的方式
int my_strlen(char* s)
{
	char* p = s;
	while (*p != '\0')
		p++;
	return p - s;
}

(二)strcpy

#include
char* my_strcpy(char* dest, const char* src)
{
	char* ret = dest;
	assert(dest && src);//断言两个指针都为非空指针

	while (*dest++ = *src++)
	{
		;
	}

	return ret;
}

(三)strcat

#include
char* my_strcat(char*dest, const char *src)
{
	assert(dest && src);//断言两个指针都为非空指针

	char* ret = dest;
	//1. 找目标空间中的\0
	while (*dest)
	{
		dest++;
	}
    //2. 赋值
	while (*dest++ = *src++)
	{
		;
	}
	return ret;
}

(四)strcmp

#include
int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);
    //断言两个指针为非空指针
	while (*str1 == *str2)
	{
		if (*str1 == '\0')
			return 0;
		str1++;
		str2++;
	}
	return (*str1 - *str2);
}

(五)strstr

char* my_strstr(char *str1, char* str2)
{
	char* cp = str1;
	char* s1 = cp;
	char* s2 = str2;

	if (*str2 == '\0')
		return str1;

	while (*cp)
	{
		//开始匹配
		s1 = cp;
		s2 = str2;
		while (*s1 && *s2 && *s1 == *s2)
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
			return cp;
		cp++;
	}
	return NULL;
}

(六)memcpy

#include
void* memcpy(void* dest, const void* src, size_t num)
{
	void* ret = dest;
	assert(dst && src);//断言两个指针为非空指针

	while (num--) 
	{
		*(char*)dest = *(char*)src;//强制转化为char*为一个字节方便逐个赋值
		dest = (char*)dest + 1;
		src = (char*)src + 1;
	}
	return ret;
}

注意:

由于dest与src为void*类型,所以不能直接++或--,可以使用

dest = (char*)dest + 1;
src = (char*)src + 1;

而不是dest++;   src++

(七)memmove

#include
void* my_memmove(void* dest, const void* src, size_t num)
{
	void* ret = dest;
	assert(dest && src);//断言两个指针为非空指针

	if (dest < src)
	{
		//前->后
		while (num--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else
	{
		//后->前
		while (num--)
		{
			*((char*)dest + num) = *((char*)src + num);
		}
	}
	return ret;
}

本篇内容就到这里,下一篇文章仍然是对字符串的讨论,我会引入旋转字符串的两种巧妙方法,关注博主不迷路

你可能感兴趣的:(C语言,c语言,学习,程序人生,笔记,算法)