C初阶4:字符串

1. 字符串操作

1.1 字符串遍历

可以通过数组方式遍历字符串。

char str[]="Hello World";
for(int i = 0;'\0' != str[i];++i){
    printf("%c\n",str[i]);
}

也可以使用指针方式

char str[]="Hello World";
for(int i = 0;'\0' != *(str+i);++i){
    printf("%c\n",*(str+i));
}

指针方式可以简化成

char str[]="Hello World";
for(;'\0' != *str;++str){
    printf("%c\n",*str);
}

甚至是

while('\0' != *str){
    printf("%c\n",*str++);
}

while(*str){
    printf("%c\n",*str++);
}

1.2 字符串赋值

char s[] = "Hello World";
char* t;
t = s;
printf("%s\n",t);

没有产生新的字符串,只是st指向相同的字符串。下面是查看两个字符串的地址。

printf("%p\n",s);
printf("%p\n",t);

试一试
字符串的修改

char s[] = "Hello World";
char* t;
t = s;
printf("%s\n",t);
t[1] = 'o';
printf("%s\n",s);
printf("%s\n",t);
s[4] = 'e';
printf("%s\n",s);
printf("%s\n",t);

指针能否反向赋值给字符串名?

char s[] = "Hello World";
char* t;
t = s;
s = t;

1.3 字符串输入输出

char str[8];
scanf("%s",str);
printf("%s\n",str);

scanf()读入一个单词直到空白符(空格、回车、Tab)
scanf()不安全,因为不知道要读入的内容长度,容易溢出。
例如:输入123456789
解决方式:指定读取的长度。

char str[8];
scanf("%7s",str);
printf("%s\n",str);

%s之间的数字表示最多允许输入的字符数,这个数字要比数组长度少1

printf()输出字符串的原理

char str[] = "Hello World";
for('\0'!=*str){
     printf("%s\n",str++);
}

字符串作为特例(传地址)存在,可以整体scanf()printf()的原因在于结尾的\0

2. 字符串与函数

2.1 字符串传参

字符串传参方式与数组传参方式一样,只不过很多时候不需要传递字符串的长度(为什么?)。

void print_string(char str[]){
    printf(str);
}

或者

void print_string(char* str){
    printf(str);
}

2.2 字符串返回

字符串返回只能使用指针char*

3. 练习

  1. 交换
    实现字符串交换函数void swap(char* s1,char* s2)
  2. 拼接
    实现字符串拼接函数char* strcat(char* s1,char* s2)
  3. 拷贝
    实现字符串拷贝函数char* strcpy(char* s1,char* s2)
  4. 比较
    实现字符串相等判断函数bool strcmp(char* s1,char* s2)

4. 字符串指针

数组可以用指针表示。

字符数组可以直接初始化字符数组,并且可以赋值给指针。

char s[]="Hello World";
char* p = s;
printf("%s\n",p);

字符串也可以直接赋值给指针。这种指针称为字符串指针。

char* str="Hello World";
printf("%s\n",str);

小结
字符数组和字符串指针初始化相似,只是形式上相似。

  • 字符数组本质是数组, char s[]="Hello World";可以看作下面代码的简化版。
    char s[]={'H','e','l','l','o',' ','W','o','r','l','d','\0'};
    
  • 字符串指针本质是指针,char* p="Hello World";可以近似看作下面代码的简化版
    const char t[]="Hello World";
    char* p = t;
    

字符串指针与字符数组的区别有以下三点:

  1. sizeofstrlen()
  2. 字符是否可修改
  3. 地址是否可修改

4.1 sizeofstrlen()

#include 
#include 

int main(){
    char arr[] = "Hello World";
    char* ptr = "Hello World";
    printf("sizeof(arr) = %ld\n",sizeof(arr));
    printf("strlen(arr) = %ld\n",strlen(arr));
    printf("sizeof(ptr) = %ld\n",sizeof(ptr));
    printf("strlen(ptr) = %ld\n",strlen(ptr));
}

4.2 替换字符

试一下下面三个例子

  1. 修改字符数组
#include 
#include 

int main(){
    char arr[] = "Hello World";
    arr[0] = 'h';
    arr[6] = 'w';
    printf("%s\n",arr);    
}
  1. 字符串指针
#include 
#include 

int main(){
    char* ptr = "Hello World";;
    *ptr = 'h';
    *(ptr+6) = 'w';
    printf("%s\n",ptr);    
}
  1. 指向字符数组的字符串指针
#include 
#include 

int main(){
    char arr[] = "Hello World";
    char* ptr = arr;
    *ptr = 'h';
    *(ptr+6) = 'w';
    printf("%s\n",ptr);    
}

4.3 地址修改

char* p = "Hello";
p = "World";
char arr[] = "Hello";
arr = "World";

4.4 小结

字符串字面量初始化字符数组
字符串字面量初始化字符串指针

char* str1 = "Hello World";
char str2[] = "Hello World";

str1[5] = '\0'; // Error
str2[5] = '\0'; // OK

printf("str1=%s\n",str1);
printf("str2=%s\n",str2);

str1是一个指针,初始化指向一个字符串常量。(在C99标准中,str1报警告,提示应该使用const char*)
修改字符串常量可能会导致严重后果。
str2是一个字符数组,初始化把字符串字面量自动复制到数组中。

如何选择?

  1. 如果需要构造字符串使用数组;如果需要处理字符串使用指针(指向字符数组的指针)。
  2. 字符串不需要修改使用字符串字面量初始化字符串指针。
  3. 字符串需要修改使用字符串字面量初始化字符数组。

决定字符串指针内容能否修改的是指向的内存,而非指针。

5. 字符串const

  1. const字符数组
#include 
#include 

int main(){
    const char arr[] = "Hello World";
    arr[0] = 'h';
    arr[6] = 'w';
    printf("%s\n",arr);    
}
  1. 指向const字符数组的字符串指针
#include 
#include 

int main(){
    const char arr[] = "Hello World";
    char* ptr = arr;
    *ptr = 'h';
    *(ptr+6) = 'w';
    printf("%s\n",ptr);    
}

决定能否修改的是指针指向的值能否修改。const的限制只针对定义为const的变量。


6. 字符串函数

6.1 字符串长度

size_t strlen(const char *s);

返回字符串长度不包含\0

6.2 字符串比较

int strcmp(const char *s1,const char *s2);

比较两个字符串
返回0,表示s1 == s2
返回>0,表示s1 > s2
返回<0,表示s1 < s2
为什么字符串不能直接比较?
为什么字符串比较会有大小?

6.3 字符串拷贝

char* strcpy(char* restrict dst,const char* restrict src);

把字符换src拷贝到dst。

restrict是C99关键字,表示指针指向内存只使用当前指针修改,便于编译器优化。在这里可表示dstsrc内存不存在重叠,便于并行处理。同时告知使用方不要使用重叠内存的两个指针使用该函数。

返回值为dst,便于连接。
连续赋值。

复制一个字符串

// char* dst = (char*)malloc(strlen(src)+1);
char dst[strlen(src)+1];
strcpy(dst,src);

6.4 字符串连接

char* strcat(char* restrict s1,const char*restrict s2);

把s2拷贝到s1的后面,拼接成一个长的字符串。
返回s1,注意:s1必须有足够的空间。

char* a="Hello";
char* b="World";
char res[strlen(a)+strlen(b)+1] = {0};
strcat(strcat(res,a),b);

strcpy和strcat都会有安全问题:dst空间不足,出现越界。

6.5 字符查找

char* strchr(const char*s,int c);
char* strrchr(const char*s,int c);

返回找到字符的指针,没找到返回NULL
如何查找第二个?

6.6 子串查找

char* strstr(const char*s1,const char*s2);
char* strcasestr(const char*s1,const char*s2);

7. 文档

学会通过例子,学会函数的使用。

stdio.h

  • sprintf:数据按格式写入字符串
  • sscanf:按格式从字符串读出数据

stdlib.h

  • atof:字符串转浮点数
  • atoi:字符串转整数
  • atol:字符串转长整数

string.h

复制

  • strcpy:字符串拷贝
  • strncpy:指定个数字符串拷贝

连接

  • strcat:字符串连接
  • strncat:指定个数字符串连接

比较

  • strcmp:字符串比较
  • strncmp:指定个数字符串比较

查找

  • strchr:查找字符串中第一个出现指定字符的位置
  • strrchr:查找字符串中最后一个出现指定字符的位置
  • strstr:查找字符串中第一个出现指定子串的位置
  • strtok:切分字符串

其他

  • strerror:获取出错信息
  • strlen:获取字符串长度

练习
实现函数times(char* dst,int n,char* src)

8. 实践

  1. 已知十天干和十二地支
    天干:甲、乙、丙、丁、戊、己、庚、辛、壬、癸
    地支:子、丑、寅、卯、辰、巳、午、未、申、酉、戌、亥
    按顺序打印出六十甲子
    甲子、乙丑、丙寅、丁卯、戊辰、己巳、庚午、辛未、壬申、癸酉、
    甲戌、乙亥、丙子、丁丑、戊寅、己卯、庚辰、辛巳、壬午、癸未、
    甲申、乙酉、丙戌、丁亥、戊子、己丑、庚寅、辛卯、壬辰、癸巳、
    甲午、乙未、丙申、丁酉、戊戌、己亥、庚子、辛丑、壬寅、癸卯、
    甲辰、乙巳、丙午、丁未、戊申、己酉、庚戌、辛亥、壬子、癸丑、
    甲寅、乙卯、丙辰、丁巳、戊午、己未、庚申、辛酉、壬戌、癸亥
  1. 已知今年的纪年,输入21世纪任意年份,打印出对应的甲子。
  2. 已知今年的纪年,打印出21世纪所有年份的甲子。
  3. 已知小明同学的属相,推断出可能的年龄。

9. 扩展

char*一定是字符串吗?
char*不一定是字符串,只有以0结尾的字符数组才是字符串。

9.1 0'\0''0'

0'\0'

'\0'表示字符串的结束,但不是字符串的一部分。计算字符串长度时不包含'\0'

字符串以数组方式存储,可以用数组或者指针形式访问。

9.2 空字符串

char str[10]="";

这是一个空字符串,str[0]\0

char str[]="";

这是也是一个空字符串,str数组长度为1

常见错误:使用未初始化的char*

char* str;
printf("%s\n",str);

同常如果指针定义时无法确定初始值时,使用NULL初始化指针。

9.3 字符串常量连接

两个相邻字符串常量会自动连接。

char greeting = "Hello" "World";

你可能感兴趣的:(C初阶4:字符串)