2017兰州大学上机(一):字符串匹配(状态机版KMP算法)

任何疑问、意见、建议请留言公众号:一航代码

题目描述:

    输入两个字符串,分别为模式串和文本串。若模式串是文本串的子字符串,则要求将文本串中的子字符串删除,并返回删除子字符串后的字符串。

输入格式:

    首先输入模式串,然后输入文本串。(均由大写或者小写字母构成,二者以空格为间隔隔开)

输出格式:

    若模式串是文本串的子字符串,输出删除子字符串后的字符串。

    若模式串不是文本串的子字符串,输出-1。

输入样例:

dfg asdfghj

输出样例:

ashj

解决方法:

(1)算法思路:

    KMP 算法(Knuth-Morris-Pratt 算法)。

    状态机思想参考:动态规划之 KMP 算法详解

(2)代码实现:

#include 
#include 
#include 
#include 
#include 
using namespace std;

vector> KMP(string pat)
{
    int M = pat.size();
    // dp[状态][字符] = 下个状态
    vector> dp(M, vector(256));
    // base case
    dp[0][pat[0]] = 1;
    // 影子状态 X 初始为 0
    int X = 0;
    // 构建状态转移图(稍改的更紧凑了)
    for (int j = 1; j < M; j++)
    {
        for (int c = 0; c < 256; c++)
        {
            dp[j][c] = dp[X][c];
            dp[j][pat[j]] = j + 1;
            // 更新影子状态
            X = dp[X][pat[j]];
        }
    }
    return dp;
}

int search(string txt, string pat, vector> dp)
{
    int M = pat.size();
    int N = txt.size();
    // pat 的初始态为 0
    int j = 0;
    for (int i = 0; i < N; i++)
    {
        // 计算 pat 的下一个状态
        j = dp[j][txt[i]];
        // 到达终止态,返回结果
        if (j == M)
            return i - M + 1;
    }
    // 没到达终止态,匹配失败
    return -1;
}

int main()
{
    string pat;//模式串
    string txt;//文本串
    cin >> pat >> txt;
    vector> dp(pat.size(), vector(256));
    dp = KMP(pat);//状态机解KMP
    int index = search(txt, pat, dp);               //匹配成功返回文本串下标
    if (index)                                      //否则返回-1
    {
        string t1 = txt.substr(0, index);           //切掉字符串前半部分
        string t2 = txt.substr(index + pat.size()); //切掉字符串后半部分
        string res = t1 + t2;                       //组合
        cout << res << endl;
    }else{
        cout<<"-1"<

2017兰州大学上机(一):字符串匹配(状态机版KMP算法)_第1张图片

 

你可能感兴趣的:(高校复试上机)