KMP算法

在应用中经常会遇到字符串比较的算法,判断一个字符串pp是否是另外一个字符串ss的子串。
注明的算法是KMP算法,现在整理如下,参考 宫水三叶 的代码实现。

// 作者 宫水三叶
// 链接 https://leetcode.cn/problems/find-the-index-of-the-first-occurrence-in-a-string/solution/shua-chuan-lc-shuang-bai-po-su-jie-fa-km-tb86/
// KMP 算法
// ss: 原串(string)  pp: 匹配串(pattern)
// 时间复杂度O(m + n)
public int kmp(String ss, String pp) {
    if (pp.isEmpty()){
        return 0;
    }

    // 分别读取原串和匹配串的长度
    int n = ss.length(), m = pp.length();
    // 原串和匹配串前面都加空格,使其下标从 1 开始
    ss = " " + ss;
    pp = " " + pp;

    char[] s = ss.toCharArray();
    char[] p = pp.toCharArray();

    // 构建 next 数组,数组长度为匹配串的长度(next 数组是和匹配串相关的)
    int[] next = new int[m + 1];
    // 构造过程 i = 2,j = 0 开始,i 小于等于匹配串长度 【构造 i 从 2 开始】
    for (int i = 2, j = 0; i <= m; i++) {
        // 匹配不成功的话,j = next(j)
        while (j > 0 && p[i] != p[j + 1]){
            j = next[j];
        }
        // 匹配成功的话,先让 j++
        if (p[i] == p[j + 1]){
            j++;
        }
        // 更新 next[i],结束本次循环,i++
        next[i] = j;
    }

    // 匹配过程,i = 1,j = 0 开始,i 小于等于原串长度 【匹配 i 从 1 开始】
    for (int i = 1, j = 0; i <= n; i++) {
        // 匹配不成功 j = next(j)
        while (j > 0 && s[i] != p[j + 1]){
            j = next[j];
        }
        // 匹配成功的话,先让 j++,结束本次循环后 i++
        if (s[i] == p[j + 1]){
            j++;
        }
        // 整一段匹配成功,直接返回下标
        if (j == m){
            return i - m;
        }
    }

    return -1;
}

如果是java的开发者,可以使用jdk自带的

// 时间复杂度O(m * n)
ss.indexOf(pp);

你可能感兴趣的:(字符串算法)