KMP算法是一种字符串匹配算法!
下面的程序利用kmp优化了字符串匹配功能相当于python中的str.find(sub)
KMP核心思想是:当匹配发生失败时,利用已经匹配串的信息来快速的移动匹配模板。
假设我们已经匹配了P(0,i),在匹配P(i+1)是失败!那么,我们需要移动匹配起点(已经匹配字符个数)-next(i)重新开始匹配。这里的next(i)是由前缀函数生成的。针对不同的匹配模板P,我们可以得到数组next。
next数组表示的是字符串P(0,i)的一个前缀最大长度,我们要求同时这个前缀又可以当作P(0,i)的后缀,想就像这样avaa.......avaa 那么这个next【i】=4
计算next数组的方式可以线性规划的方法
当我们计算next【i+1】时,
如果P【i+1】==P【next【i】】那么说明相对于之前的next【i】,扩张了一个avade.......avade,那么next【i+1】=next【i】+1
如果P【i+1】!=P【next【i】】那么next【i+1】必定是减小
比如avaae.......aavaa
那么新的next【i+1】应该在avaa中找P【k】==P【i+1】,k
avaae.......aavaa
#coding:UTF-8
__author__ = 'LQ'
def nextval(P):
#字符的前缀函数
nt=[0]#nt[]表示P直到下标i的一个偏移(及P(nt[i]-1)是P(i)真前缀的同时也是他的后缀,nt[i]是其长度)
for i in range(1,len(P)):
if P[i]==P[nt[i-1]]:#新增的字符可以根据之前的前缀扩张,
k=nt[i-1]+1
else: #新增的字符不能扩张前缀,因此在现有的前缀中找一个更小的前缀
k=nt[i-1] #在P(nt[i-1]-1)内找一个小的前缀
while (P[i]!=P[k] and k!=0):
k=nt[nt[k-1]]
nt.append(k)
return nt
def KMP(st,P):
nt=nextval(P)
s,q,k=0,0,0#s,q是当前匹配位置,k是匹配开始位置,都是从0开始
while k
顺便贴一个C语言的
#include
#include
#include
#define N 1000
void nextval(char *P,int* pi)
{
int len=strlen(P);
pi[0]=0;
int k;
for(int i=1;i