代码随想录二刷-字符串-KMP算法及相关题目(JS)

28.实现strStr()

题目

给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。

示例 1:

输入:haystack = “sadbutsad”, needle = “sad”
输出:0
解释:“sad” 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。
示例 2:

输入:haystack = “leetcode”, needle = “leeto”
输出:-1
解释:“leeto” 没有在 “leetcode” 中出现,所以返回 -1 。

提示:

1 <= haystack.length, needle.length <= 10^4
haystack 和 needle 仅由小写英文字符组成

方法

(结合卡哥的讲解)

KMP主要应用在字符串的匹配上

KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配

已经匹配的文本内容记录在next数组中,next数组是一个前缀表

前缀表是用来会退的,它记录了模式串和文本串不匹配的时候,模式串应该从哪里开始重新匹配

前缀表其实记录的是当前下标i之前(包括i)的字符串中,有多大长度的相同前后缀。

本题主要分两个步骤:

1.构造next数组;

2.使用next数组来匹配。

这两步代码很类似。这里主要介绍next数组的构造过程:

1.初始化

2.处理前后缀不一致的情况

3.处理前后缀一致的情况

【本题仅介绍前缀表统一不减一操作】

1.初始化

定义两个指针i和j,j指向前缀末尾位置,i指向后缀末尾位置

还要对next数组进行初始化赋值

let next = [];
let j = 0;
next.push(j);

2.处理前后缀不相同的情况

因为j初始化为0,那么i就从1开始,进行s[i] 与 s[j]的比较。

所以遍历模式串s的循环下标i 要从 1开始

如果 s[i] 与 s[j]不相同,也就是遇到 前后缀末尾不相同的情况,就要向前回退。

next[j]就是记录着j(包括j)之前的子串的相同前后缀的长度。

那么 s[i] 与 s[j] 不相同,就要找 j前一个元素在next数组里的值(就是next[j-1])。

所以,处理前后缀不相同的情况代码如下:

for (let i = 1;i < s.length;i++) {
    while (j > 0 && s[i] != s[j]) {
        j = next[j - 1]; // 向前回退
    }
}

3.处理前后缀相同的情况

如果 s[i] 与 s[j] 相同,那么就同时向后移动i 和j 说明找到了相同的前后缀,同时还要将j(前缀的长度)赋给next[i], 因为next[i]要记录相同前后缀的长度。

	if (s[i] == s[j]) {
        j++;
    }
	next.push(j);

代码

前缀表统一不减一操作

/**
 * @param {string} haystack
 * @param {string} needle
 * @return {number}
 */
var strStr = function(haystack, needle) {
    let next = [];
    let j = 0;
    getNext(next,needle);
    for (let i = 0;i < haystack.length;i++) {
        while (j > 0 && haystack[i] != needle[j]) {
            j = next[j - 1];
        }
        if (haystack[i] == needle[j]) {
            j++;
        }
        if (j == needle.length) {
            return (i - needle.length + 1);
        }
    }
    return -1; 
};

var getNext = function(next,needle) {
    let j = 0;
    next.push(j);
    for (let i = 1;i < needle.length;i++) {
        while (j > 0 && needle[i] != needle[j]) {
            j = next[j - 1];
        }
        if (needle[i] == needle[j]) {
            j++;
        }
        next.push(j);
    }
}

459.重复的子字符串

题目

给定一个非空的字符串 s ,检查是否可以通过由它的一个子串重复多次构成。

示例 1:

输入: s = “abab”
输出: true
解释: 可由子串 “ab” 重复两次构成。
示例 2:

输入: s = “aba”
输出: false
示例 3:

输入: s = “abcabcabcabc”
输出: true
解释: 可由子串 “abc” 重复四次构成。 (或子串 “abcabc” 重复两次构成。)

提示:

1 <= s.length <= 10^4
s 由小写英文字母组成

方法

本题是对KMP算法的简单应用

语言表述不清,借用卡哥的讲解

假设字符串s使用多个重复子串构成(这个子串是最小重复单位),重复出现的子字符串长度是x,所以s是由n * x组成。因为字符串s的最长相同前后缀的长度一定是不包含s本身,所以 最长相同前后缀长度必然是m * x,而且 n - m = 1。

数组长度为:len。

如果len % (len - (next[len - 1] )) == 0 ,则说明数组的长度正好可以被 (数组长度-最长相等前后缀的长度) 整除 ,说明该字符串有重复的子字符串。

【这里的next数组前缀统一不减一】

代码

/**
 * @param {string} s
 * @return {boolean}
 */
var repeatedSubstringPattern = function(s) {
    let next = [];
    let j = 0;
    next.push(j);
    for (let i = 1;i < s.length;i++) {
        while (j > 0 && s[i] != s[j]) {
            j = next[j - 1];
        }
        if (s[i] == s[j]) {
            j++;
        }
        next.push(j);
    }
    if (next[s.length - 1] > 0 && (s.length % (s.length - next[s.length - 1])) == 0) {
        return true;
    }
    return false;
};

你可能感兴趣的:(javascript,算法,开发语言)