Python实现KMP算法

KMP算法是一种字符串匹配算法!

下面的程序利用kmp优化了字符串匹配功能相当于python中的str.find(sub)


KMP核心思想是:当匹配发生失败时,利用已经匹配串的信息来快速的移动匹配模板。

假设我们已经匹配了P(0,i),在匹配P(i+1)是失败!那么,我们需要移动匹配起点(已经匹配字符个数)-next(i)重新开始匹配。这里的next(i)是由前缀函数生成的。针对不同的匹配模板P,我们可以得到数组next。


next数组表示的是字符串P(0,i)的一个前缀最大长度,我们要求同时这个前缀又可以当作P(0,i)的后缀,想就像这样avaa.......avaa  那么这个next【i】=4

计算next数组的方式可以线性规划的方法

当我们计算next【i+1】时,

如果P【i+1】==P【next【i】】那么说明相对于之前的next【i】,扩张了一个avade.......avade,那么next【i+1】=next【i】+1

如果P【i+1】!=P【next【i】】那么next【i+1】必定是减小

比如avaae.......aavaa

那么新的next【i+1】应该在avaa中找P【k】==P【i+1】,k

avaae.......aavaa

#coding:UTF-8
__author__ = 'LQ'


def nextval(P):
    #字符的前缀函数
    nt=[0]#nt[]表示P直到下标i的一个偏移(及P(nt[i]-1)是P(i)真前缀的同时也是他的后缀,nt[i]是其长度)
    for i in range(1,len(P)):
        if P[i]==P[nt[i-1]]:#新增的字符可以根据之前的前缀扩张,
            k=nt[i-1]+1
        else:               #新增的字符不能扩张前缀,因此在现有的前缀中找一个更小的前缀
            k=nt[i-1]     #在P(nt[i-1]-1)内找一个小的前缀
            while (P[i]!=P[k] and k!=0):
                k=nt[nt[k-1]]
        nt.append(k)
    return nt

def KMP(st,P):
    nt=nextval(P)
    s,q,k=0,0,0#s,q是当前匹配位置,k是匹配开始位置,都是从0开始
    while k
顺便贴一个C语言的

#include
#include
#include
#define N 1000

void nextval(char *P,int* pi)
{
	int len=strlen(P);
	pi[0]=0;
	int k;
	for(int i=1;i



你可能感兴趣的:(C/C++,数据结构)