目录
知识树
1、串的定义
2、串的存储结构
2.1顺序存储
静态存储
动态存储
2.2链式存储
2.3串的堆分配存储表示
3、串的基本操作
3.1求子串
3.2比较操作
3.3定位操作
4、C语言实现串的基本操作
串是由零个或多个字符组成的有限序列。在计算机科学中,常用串来表示文本、代码或数据。串是程序设计中重要的基本数据类型之一,常用于字符串匹配、文本处理和密码学等领域。
子串是指在一个字符串中取出一段连续的字符所得到的字符串。例如,在字符串 "hello world" 中,"hello"、"world"、"lo"、"l"、"rld" 都是它的子串。
空串指的是没有任何字符的字符串,表示为 ""(两个引号之间没有任何字符)。而空格串指的是只包含空格字符的字符串,例如 " "。虽然两者在形式上都是字符串,但含义不同。
串的静态存储指的是在程序运行时在固定的内存地址上分配空间来存储串。在静态存储中,串的长度是固定的,不能动态地改变。通常,在编写程序时,我们可以使用字符数组来存储字符串,这样可以方便地对字符串进行操作和访问。
例如,在C语言中,可以通过以下方式来定义一个静态的字符串:
char str[] = "hello world";
这里,str
是一个字符数组,被初始化为字符串"hello world"。在编译时,系统会为str
分配一个固定的内存空间,用来存储这个字符串。在程序运行时,我们可以通过str
来访问和修改这个字符串。需要注意的是,这个字符串的长度是固定的,即为11(包括字符串末尾的'\0'字符)。如果我们需要动态地改变字符串的长度,就需要使用动态存储方式,如堆内存或栈内存。
串的动态存储一般采用字符数组或链表进行实现。
1.字符数组
字符数组是串的静态存储方式,但可以通过动态分配内存来实现动态存储。具体实现方法为:
(1)定义一个字符指针变量,用于指向动态分配的字符数组。
(2)根据实际需要确定串的最大长度,调用C语言中的动态内存分配函数malloc()
申请空间。
(3)将申请到的空间赋值给字符指针变量。
(4)通过scanf()
、gets()
等函数向分配的空间中读入字符。
(5)使用完后,需要释放已分配的内存空间,以便于其他程序使用。
示例代码:
#include
#include
int main()
{
char* str;
int len;
printf("Input the length of the string:");
scanf("%d", &len);
str = (char*)malloc(len * sizeof(char));
if (!str)
{
printf("Memory allocation failed!\n");
return 0;
}
printf("Input the string:");
scanf("%s", str);
printf("The string you input is:%s\n", str);
free(str);
return 0;
}
2.链表
链表是动态存储的一种常见方式,可以在运行时动态增加或删除节点。对于串的存储,链表的每个节点都可以存储一个字符。链表的实现方法如下:
(1)定义一个节点结构体,包含一个字符变量和一个指向下一个节点的指针变量。
(2)定义一个头指针变量,用于指向链表的第一个节点。
(3)通过调用C语言的动态内存分配函数malloc()
申请一个节点,并将节点的指针挂在链表的末尾。
(4)向新申请的节点中存入要存储的字符。
(5)通过指针操作,可以在链表中进行插入、删除、修改等操作。
(6)使用完链表后,需要释放每个节点占用的内存空间。
示例代码:
#include
#include
typedef struct node {
char data;
struct node* next;
}Node;
int main()
{
Node* head = NULL;
Node* tail = NULL;
char c;
printf("Input the string:");
while ((c = getchar()) != '\n')
{
Node* p = (Node*)malloc(sizeof(Node));
p->data = c;
p->next = NULL;
if (head == NULL)
{
head = p;
tail = p;
}
else
{
tail->next = p;
tail = tail->next;
}
}
printf("The string you input is:");
Node* p = head;
while (p)
{
printf("%c", p->data);
p = p->next;
}
p = head;
while (p)
{
Node* t = p;
p = p->next;
free(t);
}
return 0;
}
链式存储方式是通过链表来存储串的每个字符。每个结点存储一个或多个字符,同时包括一个指向下一个结点的指针。链式存储的结构体如下所示:
typedef struct StringNode {
char data[MAXSIZE]; // 存储字符数组
int length; // 存储当前结点存储的字符个数
struct StringNode *next; // 指向下一个结点的指针
} StringNode, *String;
其中 MAXSIZE
是存储字符数组的最大长度,length
表示当前结点存储的字符个数。一个完整的链表存储了整个串,其中头结点不存储数据,只作为链表的链头,串的实际数据从第二个结点开始存储。
需要注意的是,链式存储的串的空间是动态分配的,因此可以根据具体的需求动态调整存储空间。但是,链式存储的串在访问任意一个字符时需要遍历整个链表,因此在时间复杂度上可能会存在一定的问题。
可以使用动态内存分配来实现堆分配存储表示。具体实现方法如下:
例如,以下代码演示了如何使用动态内存分配来实现堆分配存储表示的字符串拷贝操作:
#include
#include
#include
char* copy_string(char* str) {
int len = strlen(str);
char* new_str = (char*)malloc(len + 1); // 分配内存空间
strcpy(new_str, str); // 拷贝字符串到新的内存空间中
return new_str; // 返回指针
}
int main() {
char* str = "Hello, world!";
char* new_str = copy_string(str); // 使用动态内存分配实现堆分配存储表示
printf("%s\n", new_str);
free(new_str); // 释放内存空间
return 0;
}
在该代码中,copy_string函数使用malloc函数分配了一块内存空间,将传入的字符串拷贝到该空间中,并返回指向该空间的指针。在main函数中,调用copy_string函数将字符串"Hello, world!"拷贝到堆中,并输出该字符串。最后,使用free函数释放动态分配的内存空间,避免内存泄漏。
下面是C语言实现求串的子串的代码,其中包括了两种常见的方法:
方法一:暴力枚举
#include
#include
int substr(char* str, char* sub) {
int i, j, k;
int len1 = strlen(str);
int len2 = strlen(sub);
for (i = 0; i <= len1 - len2; i++) {
k = i;
for (j = 0; j < len2; j++) {
if (str[k] == sub[j]) {
k++;
} else {
break;
}
}
if (j == len2) {
return i;
}
}
return -1;
}
int main() {
char str[] = "hello world";
char sub[] = "world";
int index = substr(str, sub);
if (index < 0) {
printf("不存在子串");
} else {
printf("子串在主串中的位置是:%d", index);
}
return 0;
}
方法二:KMP算法(重重重难难难点)
#include
#include
void getNext(char* t, int* next) {
int i = 0, j = -1;
int len = strlen(t);
next[0] = -1;
while (i < len - 1) {
if (j == -1 || t[i] == t[j]) {
i++;
j++;
next[i] = j;
} else {
j = next[j];
}
}
}
int kmp(char* s, char* t, int* next) {
int i = 0, j = 0;
int len1 = strlen(s);
int len2 = strlen(t);
while (i < len1 && j < len2) {
if (j == -1 || s[i] == t[j]) {
i++;
j++;
} else {
j = next[j];
}
}
if (j == len2) {
return i - j;
} else {
return -1;
}
}
int main() {
char str[] = "hello world";
char sub[] = "world";
int next[strlen(sub)];
getNext(sub, next);
int index = kmp(str, sub, next);
if (index < 0) {
printf("不存在子串");
} else {
printf("子串在主串中的位置是:%d", index);
}
return 0;
}
两种方法的时间复杂度都是O(nm),其中n为主串的长度,m为子串的长度。但是在不同的情况下,它们的效率会有所不同,暴力枚举适用于简单的匹配问题,而KMP算法适用于较复杂的匹配问题。
#include
#include
int main()
{
char str1[50], str2[50];
int result;
printf("Enter string 1: ");
scanf("%s", str1);
printf("Enter string 2: ");
scanf("%s", str2);
result = strcmp(str1, str2);
if(result < 0)
{
printf("String 1 is less than string 2\n");
}
else if(result > 0)
{
printf("String 1 is greater than string 2\n");
}
else
{
printf("Both strings are equal\n");
}
return 0;
}
在上面的程序中,我们首先定义了两个字符串变量 str1
和 str2
,然后使用 scanf
函数分别从用户输入中读取这两个字符串。接下来,我们使用 strcmp
函数对两个字符串进行比较,并将比较结果赋值给 result
变量。最后,我们使用 if-else
语句来判断 result
的值,根据比较结果输出相应的信息。
strcmp
函数用于比较两个字符串的大小,当第一个字符串小于第二个字符串时返回一个负值,当第一个字符串大于第二个字符串时返回一个正值,当两个字符串相等时返回 0。因此,在上面的程序中,我们使用 if-else
语句对三种情况进行了判断。
在字符串操作中,最基本的操作是定位一个子串,即在一个给定的串中找到一个子串的位置。
常见的定位子串的操作包括:
暴力匹配算法:从主串的第一个字符开始与子串逐个字符比较。如果出现不匹配的字符,则从下一个字符开始重新比较。时间复杂度为$O(mn)$,其中m是子串的长度,n是主串的长度。
KMP算法:KMP算法是一种改进的暴力匹配算法,在匹配过程中根据已匹配的字符数目和子串本身的结构,跳过一些无需匹配的字符,从而提高匹配效率。时间复杂度为$O(m+n)$,其中m是子串的长度,n是主串的长度。
Boyer-Moore算法:BM算法是一种基于字符比较跳跃的算法,可以在最坏情况下只需要比较n/m次,从而提高匹配效率。时间复杂度为$O(m+n)$,其中m是子串的长度,n是主串的长度。
Rabin-Karp算法:RK算法利用哈希值来比较子串和主串,从而提高匹配效率。时间复杂度为$O(mn)$,但在实际应用中,通常能够达到较高的效率。
以上算法中,KMP算法和Boyer-Moore算法是比较常用的定位子串的算法。
在下面的程序中,我们用 get_length
函数求字符串长度,用 assign_string
函数进行字符串赋值,用 compare_string
函数比较两个字符串大小,用 concat_string
函数进行串连接,用 sub_string
函数求子串,用 replace_string
函数替换字符串中的某一部分,以及用 find_string
函数进行定位操作。
#include
#include
#include
#define MAX_LEN 100
// 求字符串长度
int get_length(char* str){
int count = 0;
while(str[count] != '\0'){
count++;
}
return count;
}
// 字符串赋值
void assign_string(char* str1, char* str2){
int len = get_length(str2);
for(int i = 0; i < len; i++){
str1[i] = str2[i];
}
str1[len] = '\0';
}
// 比较两个字符串大小
int compare_string(char* str1, char* str2){
int len1 = get_length(str1);
int len2 = get_length(str2);
int len = len1 < len2 ? len1 : len2;
for(int i = 0; i < len; i++){
if(str1[i] != str2[i]){
return str1[i] - str2[i];
}
}
return len1 - len2;
}
// 串连接
void concat_string(char* str1, char* str2){
int len1 = get_length(str1);
int len2 = get_length(str2);
for(int i = 0; i < len2; i++){
str1[len1+i] = str2[i];
}
str1[len1+len2] = '\0';
}
// 求子串
void sub_string(char* str1, char* substr, int start, int len){
int len1 = get_length(str1);
if(start < 0 || start > len1 || len <= 0){
substr[0] = '\0'; // 空串
return;
}
if(start + len > len1){
len = len1 - start;
}
for(int i = 0; i < len; i++){
substr[i] = str1[start+i];
}
substr[len] = '\0';
}
// 替换
void replace_string(char* str1, char* old_str, char* new_str){
int len1 = get_length(str1);
int len_old = get_length(old_str);
int len_new = get_length(new_str);
int i, j, k;
for(i = 0; i < len1; i++){
if(str1[i] == old_str[0]){
for(j = 1; j < len_old; j++){
if(str1[i+j] != old_str[j]){
break;
}
}
if(j == len_old){
break;
}
}
}
if(i < len1){
if(len_old == len_new){
for(k = 0; k < len_new; k++){
str1[i+k] = new_str[k];
}
}
else if(len_old < len_new){
int delta = len_new - len_old;
for(k = len1-1; k >= i+len_old; k--){
str1[k+delta] = str1[k];
}
for(k = 0; k < len_new; k++){
str1[i+k] = new_str[k];
}
str1[len1+delta] = '\0';
}
else{
int delta = len_old - len_new;
for(k = i+len_old; k <= len1; k++){
str1[k-delta] = str1[k];
}
for(k = 0; k < len_new; k++){
str1[i+k] = new_str[k];
}
}
}
}
// 定位算法
int find_string(char* str1, char* str2){
int len1 = get_length(str1);
int len2 = get_length(str2);
int i, j;
for(i = 0; i <= len1-len2; i++){
for(j = 0; j < len2; j++){
if(str1[i+j] != str2[j]){
break;
}
}
if(j == len2){
return i; // 返回第一次出现的位置
}
}
return -1; // 没有找到
}
int main(){
char str1[MAX_LEN], str2[MAX_LEN], substr[MAX_LEN], old_str[MAX_LEN], new_str[MAX_LEN];
int start, len, pos;
printf("Enter string 1: ");
scanf("%s", str1);
printf("Enter string 2: ");
scanf("%s", str2);
printf("String 1 length is %d\n", get_length(str1));
assign_string(str1, str2);
printf("String 1 after assign string 2: %s\n", str1);
printf("Compare string 1 and string 2: %d\n", compare_string(str1, str2));
concat_string(str1, str2);
printf("String 1 after concat string 2: %s\n", str1);
printf("Enter start index and length for substring: ");
scanf("%d%d", &start, &len);
sub_string(str1, substr, start, len);
printf("Substring: %s\n", substr);
printf("Enter string to be replaced: ");
scanf("%s", old_str);
printf("Enter replacement string: ");
scanf("%s", new_str);
replace_string(str1, old_str, new_str);
printf("String 1 after replace operation: %s\n", str1);
printf("Enter string to be searched: ");
scanf("%s", str2);
pos = find_string(str1, str2);
if(pos == -1){
printf("Entered string not found in string 1.\n");
}
else{
printf("Entered string found at position %d in string 1.\n", pos);
}
return 0;
}
❤️❤️❤️串基本的知识点总结就到这里啦,如果对博文还满意的话,劳烦各位看官动动“发财的小手”留下您对博文的赞和对博主的关注吧❤️❤️❤️