字符串哈希(模板)

寻找长度为n的主串S中的匹配串T(长度为m)出现的位置或次数属于字符串匹配问题。

字符串哈希就是将每个字符串转化为一个数值,然后遍历主串,判断在主串起始位置为i长度为m的字符串的哈希值与匹配串的哈希值是否相等即可,每次判断为O(1)的时间。这样就可以转化为O(n)的时间完成判断。若求字符串中第i位到第j位的哈希值(i

 

【例题】

很久很久以前,森林里住着一群兔子。

有一天,兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。

然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m,表示 m 次询问。

接下来 m 行,每行四个数字 l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。

输出格式

对于每次询问,输出一行表示结果。

如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。

数据范围

1≤length(S),m≤1000000

输入样例:

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

【代码】

#include
#include
#define ull unsigned long long
using namespace std;
const int maxn=1e6+10;
ull p[maxn],hsh[maxn];
char s[maxn];
int gethash(int l,int r)
{
    return hsh[r]-hsh[l-1]*p[r-l+1];
}
int main()
{
    scanf("%s",s+1);//从1开始存储字符
    int len=strlen(s+1);
    p[0]=1;
    for(int i=1;i<=len;i++)
    {
        hsh[i]=hsh[i-1]*131+s[i]-'a'+1;
        p[i]=p[i-1]*131;
    }
    int m;
    cin>>m;
    while(m--)
    {
        int l1,l2,r1,r2;
        cin>>l1>>r1>>l2>>r2;
        if(gethash(l1,r1)==gethash(l2,r2))
            puts("Yes");
        else
            puts("No");
    }
    return 0;
}

在计算时可以使用无符号类型的自然溢出,省去%mod。unsigned long long是对64取余。

你可能感兴趣的:(模板,算法和数据结构)