字符串哈希,是将字符串映射成哈希值(不会冲突),当我们询问每个子串的时候,我们只要将它的哈希值获取出来(时间复杂度 O ( 1 ) O(1) O(1)),那么就可以进行操作。
我们把字符串看出一个P进制的数
例如 str = “acwing”
每次预处理的时候,预处理以 i 下标结尾的字符串的哈希值,(当P = 131, Q = 2 64 2^{64} 264的时候, 99.99% 不会哈希冲突,)
和预处理 P的不同次方
所以, 当我们用unsigned long long 来存储h[N]的时候,就是相当于 mod 2 64 2^{64} 264
h[i] = (h[i-1] * P + str[i]) % Q; //str[i] 是 字符串的ASCII码
p[i] = p[i-1] * P; //p[0] = 1;
h[1] = h[0] * P + str[1];
h[2] = h[1] * P + str[2];
···
h[5] = h[4] * P + str[5];
通过以上我们我们已经预处理了每个字符串
那么, 我们可以通ULL get(int l, int r)函数来获取, str [ l , r ] [l,r] [l,r]的字符串哈希
typedef unsigned long long ULL
ULL get(int l ,int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
字符串的哈希映射一定程度上可以取代kmp
给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整 l 1 , r 1 , l 2 , r 2 l_1,r_1,l_2,r_2 l1,r1,l2,r2,请你判断 [ l 1 , r 1 ] [l_1,r_1] [l1,r1]和 [ l 2 , r 2 ] [l_2,r_2] [l2,r2] 这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
第一行包含整数 n 和 m,表示字符串长度和询问次数。
第二行包含一个长度为 nn 的字符串,字符串中只包含大小写英文字母和数字。
接下来 m 行,每行包含四个整数 l 1 , r 1 , l 2 , r 2 l_1,r_1,l_2,r_2 l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 1 开始编号。
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes
,否则输出 No
。
每个结果占一行。
1 ≤ n , m ≤ 1 0 5 1≤n,m≤10^5 1≤n,m≤105
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
Yes
No
Yes
根据以上的分析,我们只要判断两个 s t r [ l 1 , r 1 ] str[l_1, r_1] str[l1,r1] , s t r [ l 2 , r 2 ] str[l_2, r_2] str[l2,r2] 的哈希值是否相等就可以
/**
*
* 字符串哈希:
* acwing h[i] = h[i-1]*P + str[i] % Q;
* 预处理 p[i] = p[i-1] * P;
* P = 131, Q = 2 ^ 64
* 用unsigned long long 来存储
*
* [l,r] 的字符串哈希值, h[r] - h[l-1] * p[r-l+1];
**/
#include
using namespace std;
typedef unsigned long long ULL;
const int P = 131;
const int N = 100010;
ULL h[N], p[N];
char str[N];
int n, m;
ULL get(int l, int r)
{
return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
cin >> n >> m;
scanf("%s", str+1);
p[0] = 1;
//预处理
for (int i = 1; i <= n; i ++)
{
p[i] = p[i-1] * P;
h[i] = h[i-1] * P + str[i];
}
while (m -- )
{
int l1, l2, r1, r2;
scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
if (get(l1,r1) == get(l2, r2)) printf("Yes\n");
else printf("No\n");
}
return 0;
}