字符串哈希

字符串前缀哈希法

str = "ABCABCDEHGJK"

预处理每一个前缀的哈希值,如 :

h[0] = 0;

h[1] = "A"的哈希值

h[2] = "AB"的哈希值

h[3] = "ABC"的哈希值

h[4] = "ABCA"的哈希值

问题 :

  1. 如何定义一个前缀的哈希值 : 将字符串看成一个p进制的数

    比如对于字符串 "A B C D" 看成 (1 2 3 4)p

    那么转化为10进制就是 : (1p^3+2p^2+3p^1+4p^0)

    这个结果会很大,那么就将其模上一个较小的2数 : Q,转换后的范围也就是0-Q-1

    这样的话就可以将任意一个字符串映射到0-Q-1之间的一个数;

    字符串哈希_第1张图片
    • 一般情况下,不能把某一个字母映射成0,这样会将多个字符串映射成相同的p进制数,如("A","AA");

    • 一般情况下,p取131或13331,Q取2^64,在99%不会发生冲突

  2. 注意 :

  1. 哈希值用unsigned long long (Q)来存,溢出也就相当于取模了;

  2. 预处理字符串哈希值 : h[i] = h[i-1]*p+str[i]

  3. 对于字符串的一段子串[l,r]的哈希值为 : h[r] - h[l]*p^r-l+1;

  4. 对于字符串左边是高位,右边是低位

题目 : acwing - 841字符串哈希

给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2,请你判断[l1,r1]和[l2,r2]这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式 第一行包含整数n和m,表示字符串长度和询问次数。

第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。

接下来m行,每行包含四个整数l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从1开始编号。

输出格式 对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。

每个结果占一行。

数据范围

1≤n,m≤105

输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

代码 :

#include
using namespace std;
​
typedef unsigned long long ULL;
​
const int N = 100010, P = 131;
​
int n, m;
char str[N];
ULL h[N], p[N];
​
ULL get(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}
​
int main()
{
    scanf("%d%d%s", &n, &m, str + 1);
​
    p[0] = 1;
    for(int i = 1; i <= n; i++)
    {
        p[i] = p[i - 1] * P;
        h[i] = h[i - 1] * P + str[i];
    }
​
    while(m--)
    {
        int l1, r1, l2, r2;
        scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
        if(get(l1, r1) == get(l2, r2)) puts("Yes");
        else puts("No");
    }
​
    return 0;
}

你可能感兴趣的:(acwing,算法学习,哈希算法,算法,数据结构)