深入了解C语言中的字符串和内存函数

1. 前言

大家好,我是努力学习游泳的鱼。今天我们来学习一些常用的库函数。有了这些库函数,我们可以更加方便地操作字符串和内存,从而提升我们的编码效率。话不多说,我们开始吧!

注:以下大部分函数对应的头文件都是string.h。

2. 求字符串长度

2.1 strlen

size_t strlen ( const char * str );

strlen函数可以求字符串的长度。使用时只需把字符串的起始位置的地址作为参数传递给strlen。该函数会从起始位置一直往后数字符,直到遇到\0。最终返回的是\0之前字符的个数。

参数指向的字符串必须以\0结束。否则求出来的是随机值。

返回类型是size_t,是无符号类型。

接下来使用三种方式来模拟实现strlen。

// 1. 使用计数器
size_t my_strlen(const char* str)
{
	int count = 0;
	assert(str != NULL);
	while (*str != '\0')
	{
		count++;
		str++;
	}
	return count;
}

// 2. 递归
size_t my_strlen(const char* str)
{
	assert(str != NULL);
	if (*str == '\0')
		return 0;
	else
		return 1 + my_strlen(str + 1);
}

// 3. 指针-指针
size_t my_strlen(const char* str)
{
	assert(str != NULL);
	char* begin = str;
	// 找\0
	while (*str != '\0')
	{
		str++;
	}
	return str - begin;
}

3. 长度不受限制的字符串函数

3.1 strcpy

char* strcpy(char * destination, const char * source );
  • strcpy函数会把源字符串拷贝到目标空间中去。
  • 源字符串必须以\0结束。
  • 会将源字符串中的\0拷贝到目标空间。
  • 目标空间必须足够大,以确保可以存放源字符串。
  • 目标空间必须可变。
  • strcpy返回的是目标空间的起始地址。

接下来我们来模拟实现strcpy函数。

char* my_strcpy(char* dest, const char* src)
{
    char* ret = dest;
    assert(dest && src);
    while (*dest++ = *src++)
    {
        ;
    }
    return ret;
}

3.2 strcat

char * strcat ( char * destination, const char * source );
  • strcat会把源字符串追加到目标字符串后面。
  • 源字符串必须以\0结束。
  • 会把源字符串的\0拷贝到目标空间中去。
  • 目标空间必须足够大,以确保可以存放源字符串。
  • 目标空间必须可变。
  • strcat返回的是目标空间的起始地址。
  • 不能自己给自己追加,因为当源字符串和目标空间重合时,会覆盖掉源字符串后面的\0。

有没有发现,其中很多点和strcpy很像?

接下来我们来模拟实现strcat。只需要两步:

  • 找到目标空间的\0。
  • 从目标空间的\0开始,把源字符串拷贝到目标空间中去。
char* my_strcat(char* dest, const char* src)
{
	assert(dest && src);
	char* ret = dest;

	// 找目标空间的\0
	while (*dest)
	{
		dest++;
	}
	// 从目标空间的\0开始,向后拷贝
	while (*dest++ = *src++)
	{
		;
	}

	return ret;
}

3.3 strcmp

int strcmp ( const char * str1, const char * str2 );
  • strcmp函数比较的不是字符串的长度,而是比较字符串中对应位置上的字符的大小,如果相同,就比较下一对儿,直到不同或者都遇到\0。
  • 若str1str2,则返回值为正数;若str1=str2,则返回值为0。

接下来我们来模拟实现strcmp。

int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);

	while (*str1 == *str2)
	{
		if (*str1 == '\0')
		{
			return 0; // 相等
		}

		str1++;
		str2++;
	}
	// 不相等
	if (*str1 > *str2)
	{
		return 1;
	}
	else
	{
		return -1;
	}
}

4. 长度受限制的字符串函数

4.1 strncpy

char * strncpy ( char * destination, const char * source, size_t num );
  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串后,在目标的后面追加0,直到num个。

下面是strncpy的模拟实现。

char* my_strncpy(char* dest, const char* src, size_t count)
{
	assert(dest && src);
	char* start = dest;

	while (count && (*dest++ = *src++) != '\0')
	{
		count--;
	}

	if (count)
	{
		while (--count)
		{
			*dest++ = '\0';
		}
	}

	return start;
}

4.2 strncat

char * strncat ( char * destination, const char * source, size_t num );
  • 在目标空间后最多追加num个字符。
  • 如果num大于源字符串的长度,则num直接看作源字符串的长度。
  • 一定会在最后追加\0。

模拟实现如下:

char* my_strncat(char* front, const char* back, size_t count)
{
	assert(front && back);
	char* start = front;

	// 找front中的\0
	while (*front)
	{
		front++;
	}
	// 拷贝
	while (count--)
	{
		if ((*front++ = *back++) == '\0')
		{
			return start;
		}
	}

	*front = '\0';
	return start;
}

4.3 strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

只比较前num个字符。

以下是模拟实现:

int my_strncpy(const char* s1, const char* s2, size_t count)
{
	assert(s1 && s2);

	while (1)
	{
		if (count == 0)
		{
			return 0;
		}
		else if (*s1 > *s2)
		{
			return 1;
		}
		else if (*s1 < *s2)
		{
			return -1;
		}
		else
		{
			if (*s1 == '\0')
			{
				return 0;
			}
			s1++;
			s2++;
			count--;
		}
	}
}

5. 字符串查找

5.1 strstr

char * strstr ( const char *str1, const char * str2);

在str1中查找str2,如果找到了,就返回第一次出现的起始位置;如果找不到,就返回空指针NULL。

最简单的实现方式是直接暴力查找。

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);

	const char* s1 = str1;
	const char* s2 = str2;
	const char* cur = str1;

	while (*cur)
	{
		s1 = cur;
		s2 = str2;

		while (*s1 && *s2 && *s1 == *s2)
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			// 找到了
			return (char*)cur;
		}

		cur++;
	}

	// 找不到
	return NULL;
}

5.2 strtok

char * strtok ( char * str, const char * sep );
  • strtok用于分割字符串。
  • sep是一个字符串,定义了用作分隔符的字符集合。
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用\0结尾,返回一个指向这个标记的指针。(注:strtok函数会改变该字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回NULL指针。

使用举例:

#include 
#include 

int main()
{
	char arr[] = "[email protected]@456";
	char buf[30] = { 0 }; // 使用strtok,一般要做备份
	strcpy(buf, arr);
	const char* sep = "@."; // 分隔符的集合

	char* str = NULL;
	for (str = strtok(buf, sep); str != NULL; str = strtok(NULL, sep))
	{
		printf("%s\n", str);
	}

	return 0;
}

6. 错误信息报告

6.1 strerror

char * strerror ( int errnum );

会返回错误码对应的错误信息。

有一个全局变量errno,会记录库函数在调用失败后的错误码。使用时需要引用头文件errno.h。

使用举例:

#include 
#include 
#include 
#include 
#include 

int main()
{
	int* p = (int*)malloc(INT_MAX);
	if (p == NULL)
	{
		printf("%s\n", strerror(errno));
	}

	return 0;
}

7. 字符操作函数

以下函数对应的头文件是ctype.h。

7.1 字符分类函数

函数 如果它的参数复合下列条件就返回真
iscntrl 任何控制字符
isspace 任何空白字符
isdigit 十进制数字
isxdigit 十六进制数字
islower 小写字母
isupper 大写字母
isalpha 大小写字母
isalnum 大小写字母或数字
ispunct 标点符号
isgraph 图形字符
isprint  可打印字符

7.2 字符转换函数

转小写:

int tolower( int c );

转大写

int toupper( int c );

8. 内存操作函数

8.1 memcpy

void * memcpy ( void * destination, const void * source, size_t num );

函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。

这个函数在遇到'\0'的时候并不会停下来。

如果source和destination有任何的重叠,复制的结果都是未定义的。

模拟实现如下:

void* my_memcpy(void* dest, const void* src, size_t count)
{
	assert(dest && src);
	void* ret = dest;

	while (count--)
	{
		*(char*)dest = *(char*)src;
		dest = (char*)dest + 1;
		src = (char*)src + 1;
	}

	return ret;
}

8.2 memmove

void * memmove ( void * destination, const void * source, size_t num );

和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。

如果源空间和目标空间出现重叠,就得使用memmove函数处理。

模拟实现如下:

void* my_memmove(void* dest, const void* src, size_t count)
{
	assert(dest && src);
	void* ret = dest;

	if (dest < src)
	{
		// 前->后
		while (count--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else
	{
		// 后->前
		while (count--)
		{
			*((char*)dest + count) = *((char*)src + count);
		}
	}

	return ret;
}

8.3 memcmp

int memcmp ( const void * ptr1,
             const void * ptr2,
             size_t num );

比较从ptr1和ptr2指针开始的num个字节。

返回值和strcmp类似,根据大小关系返回正数、负数或者0。

模拟实现如下:

int my_memcmp(const void* ptr1, const void* ptr2, size_t num)
{
	assert(ptr1 && ptr2);

	while (num--)
	{
		if (*(char*)ptr1 > *(char*)ptr2)
		{
			return 1;
		}
		else if (*(char*)ptr1 < *(char*)ptr2)
		{
			return -1;
		}
		ptr1 = (char*)ptr1 + 1;
		ptr2 = (char*)ptr2 + 1;
	}

	return 0;
}

以上就是深入了解C语言中的字符串和内存函数的详细内容,更多关于C语言字符串 内存函数的资料请关注脚本之家其它相关文章!

你可能感兴趣的:(深入了解C语言中的字符串和内存函数)