数据结构之串:KMP算法

串:KMP算法

  • 基本概念:
  • KMP算法原理:
  • KMP算法的代码实现:
  • KMP算法的性能:

基本概念:

应用优化前提: 有部分匹配的前缀和后缀
数据结构之串:KMP算法_第1张图片

KMP算法原理:

按普通的串的模式匹配算法,在1位置比较完之后,中间还有俩次比较才能到达位置2,KMP算法解决的就是如何找到直接找到位置2,继续进行比较的。

问: 为什么会找到位置2而不是其他位置?
答: 我们发现在模式串的子串(bacba)中存在相同的最长前缀(ba)和最长后缀(ba),那进行串的模式匹配时下一个匹配的位置就是后缀=前缀的位置,即将前缀移动到上一次比较的后缀的位置上在进行比较。
当移动到下一个比较位置时,主串的标志i不需要回退,继续向后比较即可
模式串的标志j就需要回退到相同前缀的下一个数据元素,回退的位数和部分匹配值相关,若用数组next[]存储部分匹配值,则有以下公式:
在这里插入图片描述
j-1表示上次已经匹配的子串的最后一个元素的位置,next[j-1]表示部分匹配值
数据结构之串:KMP算法_第2张图片

问: 如何计算存储最长匹配值的数组next[]?
答:
数据结构之串:KMP算法_第3张图片
前缀等于后缀的最长的串的长度

例:

数据结构之串:KMP算法_第4张图片
数据结构之串:KMP算法_第5张图片
考研当中上图的next[]数组并不是最终答案,为实现算法的便利性,考研中的next[]数组会由此数组经过若干次变化得到,变化过程如下:

问: 最终的nextp[]数组如何求得?
答:
1、右移操作,将move中的next[j-1] 变成 next[j]
数据结构之串:KMP算法_第6张图片
2、加一操作将j = next[j] + 1变成 j = next[j] (有的教程不加1,具体与代码实现有关)
数据结构之串:KMP算法_第7张图片

问: 如何更加高效的求解next[]数组?
答:
数据结构之串:KMP算法_第8张图片
数据结构之串:KMP算法_第9张图片

KMP算法的代码实现:

求next[]数组:

void get_next(String T,int next[]){
     
	int i = 1,j = 0;
	next[1] = 0;
	while(i < T.length){
     
		if(j == 0 || T.ch[i] == T.ch[j]){
     
			++i;
			++j;
			next[i] = j;
		}
		else
			j = next[j];
	}
}

数据结构之串:KMP算法_第10张图片数据结构之串:KMP算法_第11张图片
kmp算法:

int Index_KMP(String S,String T,int next[],int pos){
     
	int i = pos,j = 1;
	while(i <= S.length && j <= T.length){
     
		if(j == 0 || S.ch[i] == T.ch[j]){
     
			i ++;
			j ++; 
		}
		else
			j = next[j];
	}
	if(j > T,length)
		return i - T.length;
	else
		return 0;
} 

KMP算法的性能:

时间复杂度: O(m + n)
空间复杂度: O(1)

你可能感兴趣的:(#,串)