字符串匹配——KMP算法(模板)

KMP算法的原理具体请看以下博客:
从头到尾彻底理解KMP(2014年8月22日版)(其中有关于BM算法和Sunday算法的介绍)
KMP算法最浅显理解——一看就明白
转自知乎-我见过最通俗易懂的KMP算法详解
kmp算法介绍
KMP模版 && KMP求子串在主串出现的次数模版

next数组的求法:先将next数组初始化为0,将子串和自己进行匹配,第一个不进行匹配(next[0]=-1),从第二个开始进行匹配,即从下标为1进行匹配,将其与自己从头到尾进行匹配,(即zi[1]和zi[0]匹配),若不一样则next[1+1]=0 (然后下一个zi[2]重新和zi[0]匹配),若一样则next[1+1]=1(然后下一个zi[2]和zi[1]匹配,一样就next[2+1]=2(下一个也一样就next[3+1]=3),不一样就next[2+1]=0(然后zi[2]回去和zi[0]匹配),按此规律循环下去。

next 数组各值的含义:代表当前字符之前的字符串中,有多大长度的相同前缀后缀。例如如果next [j] = k,代表j 之前的字符串中有最大长度为k 的相同前缀后缀。

在某个字符失配时,该字符对应的next 值会告诉你下一步匹配中,模式串应该跳到哪个位置(跳到next [j] 的位置)。如果next [j] 等于0或-1,则跳到模式串的开头字符,若next [j] = k 且 k > 0,代表下次匹配跳到j 之前的某个字符,而不是跳到开头,且具体跳过了k 个字符。

字符串匹配题目:对每个测试用例,输出一行结果:是否子串,是则输出"yes" ,否则输出 “no”

#include
#include
#define max 10005
char zhu[max],zi[max];///zhu为主串,zi为子串
int next[max+2];
void Get_Next(int S)///先求出next数组,S为zi的字符串长度
{
    /*int i = 0, j = -1;
    next[i] = j;
    while(i < S){
        while( j != -1 && zi[i] != zi[j]) j = next[j];///回溯,使j回到-1
        next[++i] = ++j;
    }*/ 
    //网上求next数组的模板为上面注释掉的内容,下面是自己写的求next数组
    int i=1,k=0,next[0]=-1;
    while(i<S)
    {
        if(zi[i]!=zi[k])
            i++,k=0;
        else
            i++,k++;
        next[i]=k;
    }
}
int Kmp()
{
    int S=strlen(zi),L=strlen(zhu),i=0,j=0;
    Get_Next(S);
    while(i<L)
    {
        /*while(j!=-1&&zhu[i]!=zi[j]) ///注意这里要while循环
            j=next[j];
        i++,j++;*/
        //或者也可以用上面所注释的这种写法
        if(j==-1||zhu[i]==zi[j])
            i++,j++;
        else
            j=next[j];
            
        if(j==S)
            return 1;
    }
    return 0;
}
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        scanf("%s%s",zhu,zi);
        int q=Kmp();
        if(q)
            printf("yes\n");
        else
            printf("no\n");
    }
    return 0;
}

KMP求子串在主串出现的次数模板:

求取出现的次数 :

#include
const int maxn = 1e6 + 10;
char mo[maxn], str[maxn];///mo为模式串、str为主串
int next[maxn];
inline void GetNext()
{
    int i = 0, j = -1, len = strlen(mo);
    next[i] = j;
    while(i < len){
//        if(j == -1 || mo[i] == mo[j]) next[++i] = ++j;
//        else j = next[j];
        while( j != -1 && mo[i] != mo[j]) j = next[j];
        next[++i] = ++j;
    }
}
int KmpCount()///计算模式串在子串出现的次数
{
    GetNext();
    int i = 0, j = 0, strL = strlen(str), moL = strlen(mo);
    int ans = 0;
    while(i < strL){
        while( j != -1 && mo[j] != str[i]) j = next[j];
        i++, j++;
        if(j == moL) ans++;
    }
    return ans;///返回模式串在主串中出现的次数(可重叠出现)
}
int main(void)
{
    scanf("%s %s", str, mo);
    printf("%d\n", KmpCount());
    return 0;
}

求模式串第一次在主串出现的位置 or 匹配是否在主串出现过 :

#include
const int maxn = 1e6 + 10;
char mo[maxn], str[maxn];///mo为模式串、str为主串
int next[maxn];
inline void GetNext()
{
    int i = 0, j = -1, len = strlen(mo);
    next[i] = j;
    while(i < len){
        while( j != -1 && mo[i] != mo[j]) j = next[j];
        next[++i] = ++j;
    }
}
int KmpIndex()
{
    GetNext();
    int i =0, j = 0, strL = strlen(str), moL = strlen(mo);
    while(i < strL && j < moL){//对比上面计算模式串在子串出现的次数的代码,为什么这里要加个&& j < moL
        while( j != -1 && str[i] != mo[j]) j = next[j];
        i++, j++;
    }
    if(j == moL) return i - moL;///返回模式串在主串中首次出现的位置,即完全匹配时的开始下标,下标从0开始
    else return -1;///不存在匹配情况 
}
int main(void)
{
    scanf("%s %s", str, mo);
    printf("%d\n", KmpIndex());
    return 0;
}

你可能感兴趣的:(算法,数据结构)