字符串Hash函数

字符串Hash函数把一个任意长度的字符串映射成一个非负整数,并且其冲突概率几乎为0;
字符串Hash函数:取一固定值p,把字符串看做p进制数,并分配一个大于零的的数值,代表每种字符,取一固定值M,求出该p进制对M的余数,作为该字符的Hash值
一般来说,我们取p=131或p=13331,此时Hash值产生冲突的概率极低,只要Hash值相同我们就可以以为原字符就是相等的。
·我们还可以多取一些恰当的p的M的值(列如大质数),多进行机组Hash运算,当结果都相同时才认为原字符相等
对字符地的各种操作,都可以直接对p进制数进行算术运算反映到Hash值上。
列如:S=“abc”,c=“d”,T=“xyz”;则:
S表示为p进制数:1 2 3
H(S)=1p^2+2p+3;
H(S)=1p3+2*p2+3p+4;
S+T表示为p进制数:1 2 3 24 25 26
H(S+T)=1p5+2*p4+3p3+24*p2+25p^+26
S在P进制下左移length(T)位:1 2 3 0 0 0
二者相减就是T表示为p进制数:24 25 26
H(T)=H(S+T)-(1
p2+2*p+3)*p3=24*p2+25*p+26;

例题;
很久很久以前,森林里住着一群兔子。
有一天,兔子们想要研究自己的 DNA 序列。
我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。
然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。
注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤10000001≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes

代码;

#include
#include
#include
#include
using namespace std;
const int maxn=1e6+5;
char s[maxn];
unsigned long long f[10000001],p[1000001];
int main()
{
   int n,m;
   scanf("%s",s+1);
    int len=strlen(s+1);
   p[0]=1;//p^0=1
   for(int i=1;i<=len;i++)
   {
       f[i]=f[i-1]*131+(s[i]-'a'+1);
       p[i]=p[i-1]*131;//p^i
   }
   cin>>m;
   for(int i=1;i<=m;i++)
   {
       int l1,l2,r1,r2;
       cin>>l1>>r1>>l2>>r2;
       if(f[r1]-f[l1-1]*p[r1-l1+1]==f[r2]-f[l2-1]*p[r2-l2+1])
        cout<<"Yes"<

事先处理p的n次方是个不错的想法,之前没用过;可以先定义p与M,这里直接用默认值了。

你可能感兴趣的:(字符串Hash函数)