详解字符函数和字符串函数

文章目录

  • 0. 前言
  • 1.函数介绍及部分函数模拟实现
    • 1.1 strlen
      • 模拟实现
    • 1.2 strcpy
      • 模拟实现
    • 1.3 strcat
      • 模拟实现
    • 1.4 strcmp
      • 模拟实现
    • 1.5 strncpy
    • 1.6 strncat
    • 1.7strncmp
    • 1.8 strstr
      • 模拟实现
      • 个人认为最强的KMP算法讲解视频
      • 个人认为最强的BF算法讲解视频
    • 1.9 strtok
    • 1.10 strerror
    • 1.11 memcpy
      • 模拟实现
    • 1.12 memmove
      • 模拟实现
    • 1.13 memcmp

0. 前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通畅放在常量字符串字符数组中。
字符串常量适用于那些对它不做修改的字符串函数。

1.函数介绍及部分函数模拟实现

1.1 strlen

详解字符函数和字符串函数_第1张图片

  • 字符串以'\0'作为结束标志,strlen函数返回的是在字符串中'\0'前面出现的字符个数(不包含'\0')。
  • 参数指向的字符串必须要以'\0'结束。
  • 注意函数的返回值为size_t,是无符号的(易错)。

模拟实现

三种方式:

方式1:

int my_strlen(const char *str)
{
	int count = 0;
	while(*str)
	{
		conut++;
		str++;
	}
	return count;
}

方式2:

//不能创建临时变量计数器,下面用递归的方式
int my_strlen(const char *str)
{
	if(*str == '\0')
	return 0;
	else
	return 1+my_strlen(str1);
}

详解字符函数和字符串函数_第2张图片
方式3:

//指针-指针
int my_strlen(const char *str)
{
	char *p = str;
	while(*p != '\0')
	{
		p++;
	}
	return p-str;
}	

1.2 strcpy

详解字符函数和字符串函数_第3张图片

  • 将源指向的C字符串复制到目标指向的数组中,包括终止的空字符(并在该点停止)。
  • 源字符串必须以'\0'结束。
  • 会将源字符串中的'\0'拷贝到目标空间。
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变。

模拟实现

//1.参数顺序
//2.函数的功能,停止条件
//3.assert
//4.const修饰指针
//5.函数返回值
//6.题目出自《高质量C/C++编程》最后的试题部分
char *my_strcpy(char *dest, const char *src)
{
	char *ret = dest//记录目标空间的起始地址
	asset(dest && src)//dest,src不能为NULL
	while((*dest++ = *src++))
	{
		;
	}
	return ret;
}

1.3 strcat

详解字符函数和字符串函数_第4张图片

  • 将源字符串的副本追加到目标字符串。 destination中的终止空字符被source的第一个字符覆盖,并且在destination中由这两个字符串联而成的新字符串的末尾包含一个空字符。
  • 源字符串必须以'\0'结束。
  • 目标空间必须足够大,能容纳下源字符串的内容。
  • 目标空间必须可修改。
  • 字符串自己给自己追加,如何?

模拟实现

char *my_strcat(char *dest, const char *src)
{
	char *ret = dest;
	assert(dest && src);
	//找到目标空间的'\0'
	while(*dest)
	{
		dest++;
	}
	//追加内容
	while((*dest++ = *src++))
	{
		;
	}
	return ret;
}

注意:
详解字符函数和字符串函数_第5张图片

1.4 strcmp

详解字符函数和字符串函数_第6张图片

  • 这个函数开始比较每个字符串的第一个字符。 如果它们相等,则继续比较后面的字符,直到字符不同或到达一个结束的空字符为止。
  • 标准规定:
    • 第一个字符串大于第二个字符串,则返回大于0的数字
    • 第一个字符串等于第二个字符串,则返回0
    • 第一个字符串小于第二个字符串,则返回小于0的数字
    • 那么如何判断两个字符串?

模拟实现

int my_strcmp(char *str1, const char *str2)
{
	assert(str1 && str2);
	while(*str1 == *str2)
	{
		if(*str1 == '\0')
		return 0;
		str1++;
		str2++;
	}
	return *str1-*str2;
}

1.5 strncpy

详解字符函数和字符串函数_第7张图片

  • 首先将源字符串的num个字符复制到目标字符串中。 如果在复制num个字符之前找到源C字符串的结尾(以'\0'为标志),则目标字符串将用零填充,直到将num个字符写入到目标字符串中为止。
  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

1.6 strncat

详解字符函数和字符串函数_第8张图片

  • 首先将源字符串的num个字符添加到目标字符串,并加上一个结束的空字符。
  • 如果源字符串中的C字符串长度小于num,则只复制到'\0'字符结束之前的内容。
/* strncat example */
#include 
#include 

int main ()
{
  char str1[20];
  char str2[20];
  strcpy (str1,"To be ");
  strcpy (str2,"or not to be");
  strncat (str1, str2, 6);
  puts (str1);
  return 0;
}

output:

To be or not

1.7strncmp

详解字符函数和字符串函数_第9张图片

  • 比较到出现两个字符不一样或者一个字符串结束或者num个字符全部比较完。
* strncmp example */
#include 
#include 

int main ()
{
  char str[][5] = { "R2D2" , "C3PO" , "R2A6" };
  int n;
  puts ("Looking for R2 astromech droids...");
  for (n=0 ; n<3 ; n++)
    if (strncmp (str[n],"R2xx",2) == 0)
    {
      printf ("found %s\n",str[n]);
    }
  return 0;
}

output:

Looking for R2 astromech droids...
found R2D2
found R2A6

1.8 strstr

详解字符函数和字符串函数_第10张图片

  • 返回一个指向str1中首次出现str2的指针,如果str2不是str1的一部分,则返回一个空指针。
/* strstr example */
#include 
#include 

int main ()
{
  char str[] ="This is a simple string";
  char * pch;
  pch = strstr (str,"simple");
  if (pch != NULL)
    strncpy (pch,"sample",6);
  puts (str);
  return 0;
}

output:

This is a sample string

这个例子在str中搜索“simple”子字符串并替换“sample”。

模拟实现

先捋一捋思路:
让cur指针记录从主串开始匹配的位置,让s1,s2指针分别去遍历主串和子串,如果s1 等于 s2且s1和s2都没有走完主串和子串,则s1++,s2++。如果s1 不等于s2,则cur++,s1回到cur处,s2回到起始位置即substr处。如果s2走到子串’\0’处,则表示找到了子串,返回cur。如果cur走到主串’\0’处,则表示主串不包含子串,返回NULL指针
特殊处理:如果子串是空字符串,则返回str
详解字符函数和字符串函数_第11张图片

char *my_strstr(const str, const substr)
{
	const char *s1 = str;
	const char *s2 = substr;
	const char *cur = str;
	assert(str && substr);
	if(*substr == '\0')
		return str;
	while(*cur)
	{
		s1 = cur;
		s2 = substr;
		while(*s1 && *s2 && *s1==*s2)
		{
			s1++;
			s2++;
		}
		if(*s1=='\0')
			return cur;
		cur++;
	}
	return NULL
}		

对字符串匹配算法感兴趣的同学可以看看:

个人认为最强的KMP算法讲解视频

个人认为最强的BF算法讲解视频

1.9 strtok

详解字符函数和字符串函数_第12张图片

  • sep参数是个字符串,定义了用作分隔符的字符集合
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。
/* strtok example */
#include 
#include 

int main ()
{
  char str[] ="- This, a sample string.";
  char * pch;
  printf ("Splitting string \"%s\" into tokens:\n",str);
  pch = strtok (str," ,.-");
  while (pch != NULL)
  {
    printf ("%s\n",pch);
    pch = strtok (NULL, " ,.-");
  }
  return 0;
}

output:

Splitting string "- This, a sample string." into tokens:
This
a
sample
string

1.10 strerror

详解字符函数和字符串函数_第13张图片

返回错误码,所对应的错误信息

/* strerror example : error list */
#include 
#include 
#include 

int main ()
{
  FILE * pFile;
  pFile = fopen ("unexist.ent","r");
  if (pFile == NULL)
    printf ("Error opening file unexist.ent: %s\n",strerror(errno));
  return 0;
}

Possible output:

Error opening file unexist.ent: No such file or directory
函数 如果他的参数符合下列条件就返回真
iscntrl 任何控制字符
isspace 空白字符:空格‘ ’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’
isdigit 十进制数字 0~9
isxdigit 十六进制数字,包括所有十进制数字,小写字母a-f,大写字母A-F
islower 小写字母a~z
isupper 大写字母A~Z
isalpha 字母a-z或A~Z
isalnum 字母或者数字,a-z,A-Z,0~9
ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符

字符转换:

int tolower (int c);
int toupper (int c);
/* isupper example */
#include 
#include 
int main ()
{
  int i=0;
  char str[]="Test String.\n";
  char c;
  while (str[i])
 {
    c=str[i];
    if (isupper(c)) 
        c=tolower(c);
    putchar (c);
    i++;
 }
  return 0;
}

Output:

test string.

1.11 memcpy

详解字符函数和字符串函数_第14张图片

  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
  • 如果source和destination有任何的重叠,复制的结果都是未定义的。

模拟实现

void *my_memcpy(void *dest, void *src, size_t num)
{
	assert(dest && src);
	void *ret = dest;
	while(num--)
	{
		*(char *)dest= *(char *)src;
		dest=(char *)dest + 1;
		src=(char *)src + 1:
	}
	return ret;
}

详解字符函数和字符串函数_第15张图片
那如果我们想把arr3数组中的1,3,4,5拷贝到arr3数组的3,4,5,6,7的位置,会出现什么结果?
详解字符函数和字符串函数_第16张图片
这是为什么?

详解字符函数和字符串函数_第17张图片
这是因为source空间和destination空间出现重叠,这时就得使用memmove函数来处理。

1.12 memmove

详解字符函数和字符串函数_第18张图片

  • 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
  • 如果源空间和目标空间出现重叠,就得使用memmove函数处理。

模拟实现

捋一捋思路:
详解字符函数和字符串函数_第19张图片

void *my_memmove(void *dest, const void *src, size_t num)
{
	void *ret = dest;
	assert(dest && src);
	if(dest < src)
	{
		while(num--)
		{
			*(char *)dest = *(char *)src;
			dest = *(char *)dest + 1;
			src = *(char *)src +1;
		}
	else
	{
		while(num--)
		{
			*((char *)dest+num) = *((char *)src+num);
		}
	}
	return ret;
}	

1.13 memcmp

详解字符函数和字符串函数_第20张图片

  • 比较从ptr1和ptr2指针开始的num个字节
/* memcmp example */
#include 
#include 

int main ()
{
  char buffer1[] = "DWgaOtP12df0";
  char buffer2[] = "DWGAOTP12DF0";

  int n;

  n=memcmp ( buffer1, buffer2, sizeof(buffer1) );

  if (n>0) printf ("'%s' is greater than '%s'.\n",buffer1,buffer2);
  else if (n<0) printf ("'%s' is less than '%s'.\n",buffer1,buffer2);
  else printf ("'%s' is the same as '%s'.\n",buffer1,buffer2);

  return 0;
}

Output:

'DWgaOtP12df0' is greater than 'DWGAOTP12DF0'.

DWgAOtp12Df0大于DWgAOtp12Df0,因为两个单词中的第一个不匹配字符分别是’g’和’g’,而’g’(103)计算结果大于’g’(71)。

你可能感兴趣的:(进阶C语言,c语言,开发语言)