KMP字符串匹配

题目描述:

给出两个字符串 s1 和 s2,若 s1 的区间 [l, r] 子串与 s2 完全相同,则称 s2 在 s1 中出现了,其出现位置为 l。

现在请你求出 s2 在 s1 中所有出现的位置。

定义一个字符串 s 的 border 为 s 的一个非 s 本身的子串 t,满足 t 既是 s 的前缀,又是 s 的后缀。

对于 s2,你还需要求出对于其每个前缀 s' 的最长 border t' 的长度。

输入格式

第一行为一个字符串,即为 s1。

第二行为一个字符串,即为 s2。

输出格式

首先输出若干行,每行一个整数,按从小到大的顺序输出 s2 在 s1 中出现的位置。

最后一行输出 |s2| 个整数,第 i 个整数表示 s2 的长度为 i 的前缀的最长 border 长度。

本题是一个典型的kmp算法,题目中需要我们求的border数组即为next数组。

代码:
#include 
using namespace std;
const int N = 1e6 + 10;

string s1, s2;
int m, n, border[N];

void GetNext() {
    //从零开始
    int i = 0, j = -1;
    border[0] = -1;
    while(i < n) {
        if(j == -1 || s2[i] == s2[j]) {
            i++;
            j++;
            border[i] = j;
        }
        else
            j = border[j];
    }
}

void kmp() {
    //从零开始
    int i = 0, j = 0;
    while(i < m && j < n){
        if(j == -1 || s1[i] == s2[j]) {
            i++;
            j++;
        }
        else
            j = border[j];
        //若找到,则输出此时的位置,并将j赋值为 border中的值
        if(j == n) {
            printf("%d\n", i - n + 1);
            j = border[j];
        }
    }
}

int main() {
    cin >> s1 >> s2;
    m = s1.length();
    n = s2.length();
    GetNext();
    kmp();
    for(int i = 1; i <= n; ++i)
        printf("%d ", border[i]);
    return 0;
}

你可能感兴趣的:(数据结构,算法,kmp)