字符串哈希代码模板

其实就是字符串前缀哈希。求的是前缀和。

字符串哈希代码模板_第1张图片

注意h[]数组中存放的不是字符串还是字符串的hash值。

字符串哈希代码模板_第2张图片

字符串哈希代码模板_第3张图片

任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0

可以将h[]中的每一个字符串看做一个p进制数,上图=后就是将他转化为10进制数。

字符串哈希就是假设不出现冲突,当P = 131或者1331,Q取2的64次方就能保证99.99%不会出现冲突。

我们知道long long类型数据范围最大是2的64次方,那我们取unsigned long long溢出就等于mod2的64次方。

字符串哈希代码模板_第4张图片

//字符串哈希,可以解决kmp解决不了的问题
#include
using namespace std;
using ull = unsigned long long;//原本需要mod上2的64次方,但是无符号类型溢出等价于mod
const int N = 1e5 + 9, P = 131;//p一般取131或者13331
char str[N];
int n, m;
ull p[N], h[N];//p用来存储p的多少次方

ull get(int l, int r)
{
	
	//区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
	//乘上P的二次方把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
	//也就是将ABC左移两位
	return h[r] - h[l - 1] * p[r - l + 1];//公式
}

int main()
{
	ios::sync_with_stdio(0), cin.tie(0), cout.tie(0);
	cin >> n >> m >> str + 1;
	//初始化
	p[0] = 1;
	for (int i = 1; i <= n; ++i)
	{
		p[i] = p[i - 1] * P;//p的多少次方
		h[i] = h[i - 1] * P + str[i];//字符哈希的前缀和
	}
	while (m--)
	{
		int l1, r1, l2, r2; cin >> l1 >> r1 >> l2 >> r2;
		if (get(l1, r1) == get(l2, r2)) cout << "Yes" << '\n';
		else cout << "No" << '\n';
	}
	return 0;
}

 

ull get(int l, int r)
{
	
	//区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
	//乘上P的二次方把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
	//也就是将ABC左移两位
	return h[r] - h[l - 1] * p[r - l + 1];//公式
}

上述代码就是核心代码。

字符串哈希代码模板_第5张图片 

移动完之后就可以得到l到r区间的映射的哈希值了。 

你可能感兴趣的:(哈希算法,算法,c++,数据结构)