给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。(字符为小写)
class Solution { public int strStr(String haystack, String needle) { int h = haystack.length(); int n = needle.length(); for (int i = 0; i <= h - n; i++) { if (haystack.substring(i, i + n).equals(needle)) return i; } return -1; } }
public int strStr(String haystack, String needle) {
return haystack.indexOf(needle);
static int indexOf(char[] source, int sourceOffset, int sourceCount, char[] target, int targetOffset, int targetCount, int fromIndex) {char first = target[targetOffset]; int max = sourceOffset + (sourceCount - targetCount); for (int i = sourceOffset + fromIndex; i <= max; i++) { /* Look for first character. */ if (source[i] != first) { while (++i <= max && source[i] != first); } /* Found first character, now look at the rest of v2 */ if (i <= max) { int j = i + 1; int end = j + targetCount - 1; for (int k = targetOffset + 1; j < end && source[j] == target[k]; j++, k++); if (j == end) { /* Found whole string. */ return i - sourceOffset; } } } return -1; }
RK算法的全称叫 Rabin-Karp 算法,是由它的两位发明者 Rabin 和 Karp 的名字来全名的。
按照将字符映射数字的方式,abcd 整数数组形式就是 [0, 1, 2, 3],转换公式为:h0=0*263+1*262+2*261+3*260。即按从高位到地位的顺序,将其表示成26进制。
下面来考虑窗口从 abcd 滑动到 bcde 的情况。这时候模式串从 [0, 1, 2, 3] 变成了 [1, 2, 3, 4],数组最左边的 0 被移除,同时最右边新添了 4。
L为8的时候,26L-1溢出。因此需要设置数值上限来避免溢出。设置数值上限可以用取模的方式,即用 h % modulus 来代替原本的哈希值。理论上,
modules 应该取一个很大数,对于这个问题来说 231足够了。
计算子字符串 haystack.substring(0, L) 和 needle.substring(0, L) 的哈希值。从起始位置开始遍历:从第一个字符遍历到第 N - L 个字符。
根据前一个哈希值计算滚动哈希。如果子字符串哈希值与 needle 字符串哈希值相等,返回滑动窗口起始位置。返回 -1,这时候 haystack 字符串中不存在 needle 字符串。
class Solution { // function to convert character to integer public int charToInt(int idx, String s) { return (int)s.charAt(idx) - (int)'a'; } public int strStr(String haystack, String needle) { int L = needle.length(), n = haystack.length(); if (L > n) return -1; // base value for the rolling hash function int a = 26; // modulus value for the rolling hash function to avoid overflow long modulus = (long)Math.pow(2, 31); // compute the hash of strings haystack[:L], needle[:L] long h = 0, ref_h = 0; for (int i = 0; i < L; ++i) { h = (h * a + charToInt(i, haystack)) % modulus; ref_h = (ref_h * a + charToInt(i, needle)) % modulus; } if (h == ref_h) return 0; // const value to be used often : a**L % modulus long aL = 1; for (int i = 1; i <= L; ++i) aL = (aL * a) % modulus; for (int start = 1; start < n - L + 1; ++start) { // compute rolling hash in O(1) time h = (h * a - charToInt(start - 1, haystack) * aL + charToInt(start + L - 1, haystack)) % modulus; if (h == ref_h) return start; } return -1; } }