给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
示例 1:
输入:haystack = “sadbutsad”, needle = “sad”
输出:0
解释:“sad” 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。
示例 2:
输入:haystack = “leetcode”, needle = “leeto”
输出:-1
解释:“leeto” 没有在 “leetcode” 中出现,所以返回 -1 。
提示:
1 <= haystack.length, needle.length <= 10^4
haystack 和 needle 仅由小写英文字符组成
(结合卡哥的讲解)
KMP主要应用在字符串的匹配上
KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配
已经匹配的文本内容记录在next数组中,next数组是一个前缀表
前缀表是用来会退的,它记录了模式串和文本串不匹配的时候,模式串应该从哪里开始重新匹配
前缀表其实记录的是当前下标i之前(包括i)的字符串中,有多大长度的相同前后缀。
本题主要分两个步骤:
1.构造next数组;
2.使用next数组来匹配。
这两步代码很类似。这里主要介绍next数组的构造过程:
1.初始化
2.处理前后缀不一致的情况
3.处理前后缀一致的情况
【本题仅介绍前缀表统一不减一操作】
1.初始化
定义两个指针i和j,j指向前缀末尾位置,i指向后缀末尾位置
还要对next数组进行初始化赋值
let next = [];
let j = 0;
next.push(j);
2.处理前后缀不相同的情况
因为j初始化为0,那么i就从1开始,进行s[i] 与 s[j]的比较。
所以遍历模式串s的循环下标i 要从 1开始
如果 s[i] 与 s[j]不相同,也就是遇到 前后缀末尾不相同的情况,就要向前回退。
next[j]就是记录着j(包括j)之前的子串的相同前后缀的长度。
那么 s[i] 与 s[j] 不相同,就要找 j前一个元素在next数组里的值(就是next[j-1])。
所以,处理前后缀不相同的情况代码如下:
for (let i = 1;i < s.length;i++) {
while (j > 0 && s[i] != s[j]) {
j = next[j - 1]; // 向前回退
}
}
3.处理前后缀相同的情况
如果 s[i] 与 s[j] 相同,那么就同时向后移动i 和j 说明找到了相同的前后缀,同时还要将j(前缀的长度)赋给next[i], 因为next[i]要记录相同前后缀的长度。
if (s[i] == s[j]) {
j++;
}
next.push(j);
前缀表统一不减一操作
/**
* @param {string} haystack
* @param {string} needle
* @return {number}
*/
var strStr = function(haystack, needle) {
let next = [];
let j = 0;
getNext(next,needle);
for (let i = 0;i < haystack.length;i++) {
while (j > 0 && haystack[i] != needle[j]) {
j = next[j - 1];
}
if (haystack[i] == needle[j]) {
j++;
}
if (j == needle.length) {
return (i - needle.length + 1);
}
}
return -1;
};
var getNext = function(next,needle) {
let j = 0;
next.push(j);
for (let i = 1;i < needle.length;i++) {
while (j > 0 && needle[i] != needle[j]) {
j = next[j - 1];
}
if (needle[i] == needle[j]) {
j++;
}
next.push(j);
}
}
给定一个非空的字符串 s ,检查是否可以通过由它的一个子串重复多次构成。
示例 1:
输入: s = “abab”
输出: true
解释: 可由子串 “ab” 重复两次构成。
示例 2:
输入: s = “aba”
输出: false
示例 3:
输入: s = “abcabcabcabc”
输出: true
解释: 可由子串 “abc” 重复四次构成。 (或子串 “abcabc” 重复两次构成。)
提示:
1 <= s.length <= 10^4
s 由小写英文字母组成
本题是对KMP算法的简单应用
语言表述不清,借用卡哥的讲解
假设字符串s使用多个重复子串构成(这个子串是最小重复单位),重复出现的子字符串长度是x,所以s是由n * x组成。因为字符串s的最长相同前后缀的长度一定是不包含s本身,所以 最长相同前后缀长度必然是m * x,而且 n - m = 1。
数组长度为:len。
如果len % (len - (next[len - 1] )) == 0 ,则说明数组的长度正好可以被 (数组长度-最长相等前后缀的长度) 整除 ,说明该字符串有重复的子字符串。
【这里的next数组前缀统一不减一】
/**
* @param {string} s
* @return {boolean}
*/
var repeatedSubstringPattern = function(s) {
let next = [];
let j = 0;
next.push(j);
for (let i = 1;i < s.length;i++) {
while (j > 0 && s[i] != s[j]) {
j = next[j - 1];
}
if (s[i] == s[j]) {
j++;
}
next.push(j);
}
if (next[s.length - 1] > 0 && (s.length % (s.length - next[s.length - 1])) == 0) {
return true;
}
return false;
};