KMP匹配算法

举例来说,有一个字符串"BBCABCDABABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"?

KMP匹配算法代码实现:

#include

#include

#include

#include

#include

 

using namespace std;

 

vector GetNext(const string &str)

{

   vector next({-1});//以-1开始

   for(int i=1;i<= str.size();i++)

   {

       int maxLen=0;
//       std::string tmp = str.substr(0,i);//子串计算
       for(int k = 1;k < i;++k)//计算前缀后缀的值
       {
           if(str.substr(0,k)==str.substr(i-k,k))//前缀后缀
           {
               maxLen=k;
           }
       }
       next.push_back(maxLen);

   }

   next.pop_back();

   return next;//ABCDABD    -1 0 0 0 0 1 2;

}

 

int KmpSearch(const string& s, const string& p)

{

    int sLen = s.size();

    int pLen = p.size();

    if (sLen == 0 || pLen == 0)return -1;

    vector next = GetNext(p);

    int i = 0;

    int j = 0;

    while (i < sLen && j < pLen)

    {

        ////j == -1,kmp匹配失败,跳过本字节,下字节开始继续匹配;

        //j >= 0,本字节开始匹配,模式串调到j开始

        if (j == -1 || s[i] == p[j])

        {

            i++;

            j++;

        }

        else

        {//从模式串的第几个字节失败则跳到指定位置继续尝试,如在第7字节失败,则跳到第三字节开始(下标为前面子串最大前后匹配长度)

            j = next[j];//ABCDABD    -1 0 0 0 0 1 2;

        }

    }

    if (j == pLen) return i - j;//返回第一个完全匹配位置

    

    return -1;

}

 

 

/*

输出

tmp:A

maxLen:0

tmp:AB

maxLen:0

tmp:ABC

maxLen:0

tmp:ABCD

maxLen:0

tmp:ABCDA

maxLen:1

tmp:ABCDAB

maxLen:2

tmp:ABCDABD

maxLen:0

res :2

*/

int main()

{

    string s = "BBABCDABDKA";

    string p = "ABCDABD";

    int res = KmpSearch(s,p);

    cout << "res :" <

    return 0;

}

 

 

(2)next数组求取设计

前缀后缀长度求取以及next数组获取:

如果给定的模式串是:“ABCDABD”,从左至右遍历整个模式串,其各个子串的前缀后缀分别如下表格所示:

KMP匹配算法_第1张图片

也就是说,原模式串子串对应的各个前缀后缀的公共元素的最大长度表为:

0 0 0 0 1 2 0;

故对应的next数组为:-1 0 0 0 0 1 2;

(注意:这里的字符串下标是从0开始的,若从1开始,next数组所有元素都对应要加1。)

 

 

你可能感兴趣的:(算法)