KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。
Border n.边界;边境;国界;边界地区;边疆;镶边;包边;(草坪边等的)狭长花坛
一个字符串的 border 指的是这个字符串的 最长公共前后缀 ,border 的长度不能等于原字符串的长度,例如:
abbab 的 border 就是ab,因为 ab 既是 abbab 的前缀也是后缀。
N e x t i Next_i Nexti 表示以下标 i i i 为结尾的前缀的 border 的长度。
如果 t n e x t i + 1 = t i + 1 t_{next_i+1}=t_{i+1} tnexti+1=ti+1 那么 n e x t i + 1 next_{i+1} nexti+1 显然应该等于 n e x t i + 1 next_i+1 nexti+1
如果 t n e x t i + 1 ≠ t i + 1 t_{next_i+1}\not= t_{i+1} tnexti+1=ti+1 前缀next[i]的border,也即前缀next[next[i]],他同时也是前缀next[i]的后缀,而前缀next[i]又是i的后缀,所以前缀next[next[i]]也是前缀i的后缀。
void getnechst(string s){
int i,j;
for(nechst[1]=j=0,i=2;s[i];i++){
while(j&&s[i]!=s[j+1]){
j=nechst[j];
}
if(s[i]==s[j+1]){
j++;
}
nechst[i]=j;
}
}
洛谷 P3375 【模板】KMP
#include
using namespace std;
int nechst[1000005],ans;
void getnechst(string s){
int i,j;
for(nechst[1]=j=0,i=2;s[i];i++){
while(j&&s[i]!=s[j+1]){
j=nechst[j];
}
if(s[i]==s[j+1]){
j++;
}
nechst[i]=j;
}
}
void kmp(string s,string s1){
int i,j;
for(j=0,i=1;s1[i];i++){
while(j&&s1[i]!=s[j+1]){
j=nechst[j];
}
if(s1[i]==s[j+1]){
j++;
}
if(!s[j+1]){
printf("%d\n",i-j+1);
j=nechst[j];
}
}
}
int main(){
string s,s1;
cin>>s>>s1;
s=' '+s;
s1=' '+s1;
getnechst(s1);
kmp(s1,s);
for(int i=1;s1[i];i++){
printf("%d ",nechst[i]);
}
return 0;
}
给定三个字符串,从第一个字符串中取出一个子串,要求包含第二个子串和第三个子串,求满足条件的最短子串
利用vector存储子串的匹配位置,再进行二分查找
#include
using namespace std;
long long nechst[200005];
vector<long long>vl1,vl2,vr1,vr2;
vector<pair<long long,long long> >rg;
string ans;
long long ansr=0x3f3f3f3f,ansl;
void update(long long l,long long r){
if(ansr-ansl>r-l){
ansr=r;
ansl=l;
rg.clear();
rg.push_back(make_pair(l,r));
}
else if(ansr-ansl+1==r-l+1){
rg.push_back(make_pair(l,r));
}
}
void getnechst(char s[]){
int i,j;
nechst[i]=0;
for(j=0,i=2;s[i];i++){
while(j&&s[i]!=s[j+1]){
j=nechst[j];
}
if(s[i]==s[j+1]){
j++;
}
nechst[i]=j;
}
}
void getans(string s){
if(ans.size()==0||ans>s){
ans=s;
}
}
void kmp(char s[],char s1[],vector<long long>& vl,vector<long long>& vr){
long long n=strlen(s1+1);
getnechst(s1);
long long i,j,sum=0;
for(j=0,i=1;s[i];i++){
while(j&&s[i]!=s1[j+1]){
j=nechst[j];
}
if(s[i]==s1[j+1]){
j++;
}
if(!s1[j+1]){
vl.push_back(i-n+1);
vr.push_back(i);
j=nechst[j];
}
}
}
int main(){
char s[200005],s1[105],s2[105];
scanf("%s%s%s",s+1,s1+1,s2+1);
kmp(s,s1,vl1,vr1);
kmp(s,s2,vl2,vr2);
long long n=vl1.size(),m=vl2.size();
if(n==0||m==0){
printf("No");
return 0;
}
for(int i=0;i<n;i++){
long long idx=lower_bound(vr2.begin(),vr2.end(),vl1[i])-vr2.begin();
if(idx!=m){
update(min(vl1[i],vl2[idx]),max(vr1[i],vr2[idx]));
}
idx--;
if(idx>=0){
update(min(vl1[i],vl2[idx]),max(vr1[i],vr2[idx]));
}
}
long long len=rg.size();
for(int i=0;i<len;i++){
char t=s[rg[i].second+1];
s[rg[i].second+1]='\0';
getans(string(s+rg[i].first));
s[rg[i].second+1]=t;
}
cout<<ans;
return 0;
}