KMP算法中next数组的计算方法

其他的部分看其他的博客就好啦,主要讲计算next数组时的思想。
主要对http://www.cnblogs.com/c-cloud/p/3224788.html。

void makeNext(const char P[],int next[])
{
    int q,k;//q:模版字符串下标;k:最大前后缀长度
    int m = strlen(P);//模版字符串长度
    next[0] = 0;//模版字符串的第一个字符的最大前后缀长度为0
    for (q = 1,k = 0; q < m; ++q)//for循环,从第二个字符开始,依次计算每一个字符对应的next值
    {
        while(k > 0 && P[q] != P[k])//递归的求出P[0]···P[q]的最大的相同的前后缀长度k
            k = next[k-1];          //不理解没关系看下面的分析,这个while循环是整段代码的精髓所在,确实不好理解  
        if (P[q] == P[k])//如果相等,那么最大相同前后缀长度加1
        {
            k++;
        }
        next[q] = k;
    }
}

可能比较难以理解的就是这里了。
1. 已知前一步计算时最大相同的前后缀长度为k(k>0),即P[0]···P[k-1];
2. 此时比较第k项P[k]与P[q]
3. 如果P[K]等于P[q],那么很简单跳出while循环
4. 关键!关键有木有!关键如果不等呢???那么我们应该利用已经得到的next[0]···next[k-1]来求P[0]···P[k-1]这个子串中最大相同前后缀,可能有同学要问了——为什么要求P[0]···P[k-1]的最大相同前后缀呢???是啊!为什么呢? 原因在于P[k]已经和P[q]失配了,而且P[q-k] ··· P[q-1]又与P[0] ···P[k-1]相同,看来P[0]···P[k-1]这么长的子串是用不了了,那么我要找个同样也是P[0]打头、P[k-1]结尾的子串即P[0]···Pj-1,看看它的下一项P[j]是否能和P[q]匹配

第四条这里说的比较迷糊,为何要
while(k > 0 && P[q] != P[k])
k = next[k-1];
主要是看下,因为这个时候0 - k1已经不能用了,此时数组的值不可能是k-1了,必然比k-1小,往回走,看下0 - 哪个位置是可以对照一下的,就是找个更短的子串,是不是前缀和后缀的集合,最坏的情况下就是没有,就是0。

你可能感兴趣的:(算法)