串的类型定义、存储结构及运算

1.串的顺序存储结构

# define MAXLEN 255
	typedef struct{
		char ch[MAXLEN+1];
		int length;
	}SString;

2.串的链式存储结构——块链结构

因为传统的链式结构存储密度低,可以将多个字符存放在一个结点中,以客服其缺点,称为块链结构。

#define CHUNKSIZE 80
typedef struct Chunk{
	char ch[CHUNKSIZE];
	struct Chunk *next;
}Chunk;

typedef struct{
	Chunk *head,*tail;
	int curlen;
}LString;

3.串的模式匹配算法

算法目的:确定主串中所含(模式串)第一次出现的位置
算法应用:搜索引擎、拼写检查、语言翻译、数据压缩
算法种类:BF算法,KMP算法。

Brute-Force 简称为BF算法,也称为简单匹配算法,采用穷举法的思路

举例:
串的类型定义、存储结构及运算_第1张图片
BF算法设计思想:

Index(S,T,pos)
将主串的第pos个字符和模式串的第一个字符比较;
若相等,继续逐个比较后续字符
若不等,从主串的下一字符起,重新与模式串的第一个字符比较。
直到主串的一个连续子串字符序列与模式串相等。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。 否则,匹配失败,返回值为0。

int Index_BF(SString S,SString T){
	int i=1,j=1;
	while(i<=S.length&&j<=T.length){
		if(s.ch[i]==t.ch[j]){
			++i;++j;
		}
		else{i=i-j+2;j=1;} 
	}
	if(j>=T.length return i-T.length;)
	else return 0;  //匹配不成功
}

算法时间复杂度:
串的类型定义、存储结构及运算_第2张图片

KMP算法

思想:利用已经部分匹配的结果而加快模式串的滑动速度,且主串S的指针i不必回溯
串的类型定义、存储结构及运算_第3张图片
这里需要定义一个next[j] 函数,表明当模式中第j个字符串与主串中相应字符“失配”时,在模式中需要重新和主串中该字符进行比较的字符的位置。

串的类型定义、存储结构及运算_第4张图片
串的类型定义、存储结构及运算_第5张图片
代码表示:

int Index_KMP(SString S,String T,int pos){
	i=pos,j=1;
	while(i<S.length && j<T.length){
		if(j==0||S.ch[i]==T.ch[j]){i++;j++}
		else
			j=next[j];  //i不变,j后退
	}
	if(j>T.length)
		return i-T.length;  //匹配成功;
		else return 0;
}

next函数的改进:nextval
串的类型定义、存储结构及运算_第6张图片
代码:

void get_nextval(SString T,int &nextval[]){
	i=1;nextval[1]=0;j=0;
	while(i<T.length){
		if(j==0||T.ch[i]==T.ch[j]){
			++i;++j;
			if(T.ch[i]!=T.ch[j])nextval[i]=j;
			else  nextval[i]=nextval[j];
		}
		else  j=nextval[j];
	}
}

你可能感兴趣的:(数据结构)