哈希表、字符串哈希(特别的kmp)

哈希表、字符串哈希(特别的kmp)

    • 哈希表存储结构(处理冲突)
      • 拉链法
      • 840. 模拟散列表
      • 开放寻址法
    • 字符串哈希法
      • 841. 字符串哈希(kmp的一种特别形式)

哈希表存储结构(处理冲突)

拉链法

链式前向星存储邻接表的结构
哈希表长度取成一个质数,且离2的整次幂尽可能远,大于题目查找范围的最小质数

840. 模拟散列表

维护一个集合,支持如下几种操作:

I x,插入一个数 x;
Q x,询问数 x 是否在集合中出现过;
现在要进行 N 次操作,对于每个询问操作输出对应的结果。

输入格式
第一行包含整数 N,表示操作数量。

接下来 N 行,每行包含一个操作指令,操作指令为 I x,Q x 中的一种。

输出格式
对于每个询问指令 Q x,输出一个询问结果,如果 x 在集合中出现过,则输出 Yes,否则输出 No。

每个结果占一行。

数据范围
1 ≤ N ≤ 1 0 5 1≤N≤10^5 1N105
− 1 0 9 ≤ x ≤ 1 0 9 −10^9≤x≤10^9 109x109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No

#include
using namespace std;
const int N=100003;
struct node{
	int to;
	int next;
}e[N];
int cnt;
int h[N];
void insert(int x){
	int k=(x%N+N)%N;
	e[++cnt].to=x;
	e[cnt].next=h[k];
	h[k]=cnt;
}
bool find(int x){
	int k=(x%N+N)%N;
	for(int i=h[k];i;i=e[i].next){
		if(e[i].to==x)return true;
	}
	return false;
}
int main(){
	int n;
	cin>>n;
	char op;
	int x;
	while(n--){
		cin>>op>>x;
		if(op=='I')insert(x);
		if(op=='Q'){
			if(find(x))cout<<"Yes"<<endl;
			else cout<<"No"<<endl;
		}
	}
	
    return 0;
}

开放寻址法

一维数组,开到题目数据范围的2~3倍,大于题目查找范围两倍的最小质数

#include
#include 
using namespace std;
const int N=200003,null=0x3f3f3f3f;
int h[N];
int find(int x){
	int k=(x%N+N)%N;
	while(h[k]!=null&&h[k]!=x){
		k++;
		if(k==N)k=0;
	}
	return k;
}
int main(){
	int n;
	cin>>n;
	char op;
	int x;
	memset(h,0x3f,sizeof(h));	
	while(n--){
		cin>>op>>x;
		if(op=='I')h[find(x)]=x;;
		if(op=='Q'){
			if(h[find(x)]==null)cout<<"No"<<endl;
			else cout<<"Yes"<<endl;
		}
	}
	
    return 0;
}

字符串哈希法

字符串前缀哈希法
预处理出来所有前缀的哈希
如何定义每一个前缀的哈希值
看成一个p进制数,把字符串转化为以恶搞数字

哈希表、字符串哈希(特别的kmp)_第1张图片
1、不能把某个字符映射成0,否则冲突了
A——0
AA——0
2、假定不会出现冲突
经验值
P=131、13331
Q = 2 64 Q=2 ^{64} Q=264
这么取 99.9 99.9% 99.9不会出现冲突
前面的哈希可以容忍冲突然后处理冲突,
字符串哈希假定人品爆棚不出现冲突,不考虑出现冲突
3、利用前缀哈希通过公式计算出所有子串的哈希值

(字符串哈希) O(n)+O(m)O(n)+O(m)
全称字符串前缀哈希法,把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。 对形如
X 1 X 2 X 3 ⋯ X n − 1 X n X 1 X 2 X 3 ⋯ X n − 1 X n X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn X1X2X3Xn1XnX1X2X3Xn1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。

映射公式 ( X 1 × P n − 1 + X 2 × P n − 2 + ⋯ + X n − 1 × P 1 + X n × P 0 ) m o d Q (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ (X1×Pn1+X2×Pn2++Xn1×P1+Xn×P0)modQ 注意点:

  1. 任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
  2. 冲突问题:通过巧妙设置P (131 或 13331) , Q (264)(264)的值,一般可以理解为不产生冲突。

问题是比较不同区间的子串是否相同,就转化为对应的哈希值是否相同。
求一个字符串的哈希值就相当于求前缀和,求一个字符串的子串哈希值就相当于求部分和。

前缀和公式 h [ i + 1 ] = h [ i ] × P + s [ i ] h [ i + 1 ] = h [ i ] × P + s [ i ] i ∈ [ 0 , n − 1 ] i ∈ [ 0 , n − 1 ] h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i] i∈[0,n−1]i∈[0,n−1] h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i]i[0,n1]i[0,n1]
h为前缀和数组,s为字符串数组 区间和公式
h [ l , r ] = h [ r ] − h [ l − 1 ] × P r − l + 1 h [ l , r ] = h [ r ] − h [ l − 1 ] × P r − l + 1 h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1 h[l,r]=h[r]h[l1]×Prl+1h[l,r]=h[r]h[l1]×Prl+1

区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位, 乘上 P2P2 把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。

作者:chocolate-emperor 链接:https://www.acwing.com/solution/content/24738/
来源:AcWing

841. 字符串哈希(kmp的一种特别形式)

给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l 1 , r 1 , l 2 , r 2 l1,r1,l2,r2 l1,r1,l2,r2,请你判断 [ l 1 , r 1 ] 和 [ l 2 , r 2 ] [l1,r1] 和 [l2,r2] [l1,r1][l2,r2] 这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式
第一行包含整数 n 和 m,表示字符串长度和询问次数。

第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。

接下来 m 行,每行包含四个整数 l 1 , r 1 , l 2 , r 2 l1,r1,l2,r2 l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从 1 开始编号。

输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No。

每个结果占一行。

数据范围
1 ≤ n , m ≤ 1 0 5 1≤n,m≤10^5 1n,m105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes

#include
#include 
using namespace std;
const int N=1e5+7,P=131;//字符串哈希值结果很大需要对2^64取模 
typedef unsigned long long ULL;//unsigned long long 64位 
ULL p[N];//p[i]表示P的i次幂,预处理储存起来 
ULL h[N];
char str[N];
ULL get(int l,int r){
	return h[r]-h[l-1]*p[r-l+1];
}
int main(){
	int n,m;
	cin>>n>>m;
//	for(int i=1;i<=n;i++){
//		cin>>str[i];
//	}
	cin>>str+1;
	p[0]=1;
	//不能映射成0,所以哈希表数组是从下标1开始的 
	for(int i=1;i<=n;i++){
		p[i]=p[i-1]*P;
		h[i]=h[i-1]*P+str[i]; //小写字母97-122
	}
	int l1,r1,l2,r2;
	while(m--){
		cin>>l1>>r1>>l2>>r2;
		if(get(l1,r1)==get(l2,r2))cout<<"Yes"<<endl;
		else cout<<"No"<<endl;
	}
    return 0;
}

你可能感兴趣的:(字符串,数据结构,#,哈希表,哈希算法,散列表,算法)