KMP 笔记

KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。

Border

Border n.边界;边境;国界;边界地区;边疆;镶边;包边;(草坪边等的)狭长花坛

一个字符串的 border 指的是这个字符串的 最长公共前后缀border 的长度不能等于原字符串的长度,例如:
abbabborder 就是ab,因为 ab 既是 abbab 的前缀也是后缀。

Next 表

N e x t i Next_i Nexti 表示以下标 i i i 为结尾的前缀的 border 的长度。

求解 Next 表

如果 t n e x t i + 1 = t i + 1 t_{next_i+1}=t_{i+1} tnexti+1=ti+1 那么 n e x t i + 1 next_{i+1} nexti+1 显然应该等于 n e x t i + 1 next_i+1 nexti+1
如果 t n e x t i + 1 ≠ t i + 1 t_{next_i+1}\not= t_{i+1} tnexti+1=ti+1 前缀next[i]的border,也即前缀next[next[i]],他同时也是前缀next[i]的后缀,而前缀next[i]又是i的后缀,所以前缀next[next[i]]也是前缀i的后缀。

getnext函数模板

void getnechst(string s){
	int i,j;
	for(nechst[1]=j=0,i=2;s[i];i++){
		while(j&&s[i]!=s[j+1]){
			j=nechst[j];
		}
		if(s[i]==s[j+1]){
			j++;
		}
		nechst[i]=j;
	}
}

题目

1. 模板题 字符串匹配

洛谷 P3375 【模板】KMP

#include
using namespace std;
int nechst[1000005],ans;
void getnechst(string s){
	int i,j;
	for(nechst[1]=j=0,i=2;s[i];i++){
		while(j&&s[i]!=s[j+1]){
			j=nechst[j];
		}
		if(s[i]==s[j+1]){
			j++;
		}
		nechst[i]=j;
	}
}
void kmp(string s,string s1){
	int i,j;
	for(j=0,i=1;s1[i];i++){
		while(j&&s1[i]!=s[j+1]){
			j=nechst[j];
		}
		if(s1[i]==s[j+1]){
			j++;
		}
		if(!s[j+1]){
			printf("%d\n",i-j+1);
			j=nechst[j];
		}
	}
}
int main(){
	string s,s1;
	cin>>s>>s1;
	s=' '+s;
	s1=' '+s1;
	getnechst(s1);
	kmp(s1,s);
	for(int i=1;s1[i];i++){
		printf("%d ",nechst[i]);
	}
	return 0;
}

2. 终曲(加强版)

题意

给定三个字符串,从第一个字符串中取出一个子串,要求包含第二个子串和第三个子串,求满足条件的最短子串

思路

利用vector存储子串的匹配位置,再进行二分查找

代码

#include
using namespace std;
long long nechst[200005];
vector<long long>vl1,vl2,vr1,vr2;
vector<pair<long long,long long> >rg;
string ans;
long long ansr=0x3f3f3f3f,ansl;
void update(long long l,long long r){
	if(ansr-ansl>r-l){
		ansr=r;
		ansl=l;
		rg.clear();
		rg.push_back(make_pair(l,r));
	}
	else if(ansr-ansl+1==r-l+1){
		rg.push_back(make_pair(l,r));
	}
}
void getnechst(char s[]){
	int i,j;
	nechst[i]=0;
	for(j=0,i=2;s[i];i++){
		while(j&&s[i]!=s[j+1]){
			j=nechst[j];
		}
		if(s[i]==s[j+1]){
			j++;
		}
		nechst[i]=j;
	}
}
void getans(string s){
	if(ans.size()==0||ans>s){
		ans=s;
	}
}
void kmp(char s[],char s1[],vector<long long>& vl,vector<long long>& vr){
	long long n=strlen(s1+1);
	getnechst(s1);
	long long i,j,sum=0;
	for(j=0,i=1;s[i];i++){
		while(j&&s[i]!=s1[j+1]){
			j=nechst[j];
		}
		if(s[i]==s1[j+1]){
			j++;
		}
		if(!s1[j+1]){
			vl.push_back(i-n+1);
			vr.push_back(i);
			j=nechst[j];
		}
	}
}
int main(){
		char s[200005],s1[105],s2[105];
		scanf("%s%s%s",s+1,s1+1,s2+1);
		kmp(s,s1,vl1,vr1);
		kmp(s,s2,vl2,vr2);
		long long n=vl1.size(),m=vl2.size();
		if(n==0||m==0){
			printf("No");
			return 0;
		}
		for(int i=0;i<n;i++){
			long long idx=lower_bound(vr2.begin(),vr2.end(),vl1[i])-vr2.begin();
			if(idx!=m){
				update(min(vl1[i],vl2[idx]),max(vr1[i],vr2[idx]));
			}
			idx--;
			if(idx>=0){
				update(min(vl1[i],vl2[idx]),max(vr1[i],vr2[idx]));
			}
			
		}
		long long len=rg.size();
		for(int i=0;i<len;i++){
			char t=s[rg[i].second+1];
			s[rg[i].second+1]='\0';
			getans(string(s+rg[i].first));
			s[rg[i].second+1]=t;
		}
		cout<<ans;
	return 0;
}

你可能感兴趣的:(笔记,c++,KMP,字符串)