链式前向星存储邻接表的结构
哈希表长度取成一个质数,且离2的整次幂尽可能远,大于题目查找范围的最小质数
维护一个集合,支持如下几种操作:
I x,插入一个数 x;
Q x,询问数 x 是否在集合中出现过;
现在要进行 N 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 N,表示操作数量。
接下来 N 行,每行包含一个操作指令,操作指令为 I x,Q x 中的一种。
输出格式
对于每个询问指令 Q x,输出一个询问结果,如果 x 在集合中出现过,则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1 ≤ N ≤ 1 0 5 1≤N≤10^5 1≤N≤105
− 1 0 9 ≤ x ≤ 1 0 9 −10^9≤x≤10^9 −109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
#include
using namespace std;
const int N=100003;
struct node{
int to;
int next;
}e[N];
int cnt;
int h[N];
void insert(int x){
int k=(x%N+N)%N;
e[++cnt].to=x;
e[cnt].next=h[k];
h[k]=cnt;
}
bool find(int x){
int k=(x%N+N)%N;
for(int i=h[k];i;i=e[i].next){
if(e[i].to==x)return true;
}
return false;
}
int main(){
int n;
cin>>n;
char op;
int x;
while(n--){
cin>>op>>x;
if(op=='I')insert(x);
if(op=='Q'){
if(find(x))cout<<"Yes"<<endl;
else cout<<"No"<<endl;
}
}
return 0;
}
一维数组,开到题目数据范围的2~3倍,大于题目查找范围两倍的最小质数
#include
#include
using namespace std;
const int N=200003,null=0x3f3f3f3f;
int h[N];
int find(int x){
int k=(x%N+N)%N;
while(h[k]!=null&&h[k]!=x){
k++;
if(k==N)k=0;
}
return k;
}
int main(){
int n;
cin>>n;
char op;
int x;
memset(h,0x3f,sizeof(h));
while(n--){
cin>>op>>x;
if(op=='I')h[find(x)]=x;;
if(op=='Q'){
if(h[find(x)]==null)cout<<"No"<<endl;
else cout<<"Yes"<<endl;
}
}
return 0;
}
字符串前缀哈希法
预处理出来所有前缀的哈希
如何定义每一个前缀的哈希值
看成一个p进制数,把字符串转化为以恶搞数字
1、不能把某个字符映射成0,否则冲突了
A——0
AA——0
2、假定不会出现冲突
经验值
P=131、13331
Q = 2 64 Q=2 ^{64} Q=264
这么取 99.9 99.9% 99.9不会出现冲突
前面的哈希可以容忍冲突然后处理冲突,
字符串哈希假定人品爆棚不出现冲突,不考虑出现冲突
3、利用前缀哈希通过公式计算出所有子串的哈希值
(字符串哈希) O(n)+O(m)O(n)+O(m)
全称字符串前缀哈希法,把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。 对形如
X 1 X 2 X 3 ⋯ X n − 1 X n X 1 X 2 X 3 ⋯ X n − 1 X n X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。映射公式 ( X 1 × P n − 1 + X 2 × P n − 2 + ⋯ + X n − 1 × P 1 + X n × P 0 ) m o d Q (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ 注意点:
- 任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
- 冲突问题:通过巧妙设置P (131 或 13331) , Q (264)(264)的值,一般可以理解为不产生冲突。
问题是比较不同区间的子串是否相同,就转化为对应的哈希值是否相同。
求一个字符串的哈希值就相当于求前缀和,求一个字符串的子串哈希值就相当于求部分和。前缀和公式 h [ i + 1 ] = h [ i ] × P + s [ i ] h [ i + 1 ] = h [ i ] × P + s [ i ] i ∈ [ 0 , n − 1 ] i ∈ [ 0 , n − 1 ] h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i] i∈[0,n−1]i∈[0,n−1] h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i]i∈[0,n−1]i∈[0,n−1]
h为前缀和数组,s为字符串数组 区间和公式
h [ l , r ] = h [ r ] − h [ l − 1 ] × P r − l + 1 h [ l , r ] = h [ r ] − h [ l − 1 ] × P r − l + 1 h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1 h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位, 乘上 P2P2 把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
作者:chocolate-emperor 链接:https://www.acwing.com/solution/content/24738/
来源:AcWing
给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l 1 , r 1 , l 2 , r 2 l1,r1,l2,r2 l1,r1,l2,r2,请你判断 [ l 1 , r 1 ] 和 [ l 2 , r 2 ] [l1,r1] 和 [l2,r2] [l1,r1]和[l2,r2] 这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 n 和 m,表示字符串长度和询问次数。
第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。
接下来 m 行,每行包含四个整数 l 1 , r 1 , l 2 , r 2 l1,r1,l2,r2 l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 1 开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1 ≤ n , m ≤ 1 0 5 1≤n,m≤10^5 1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
#include
#include
using namespace std;
const int N=1e5+7,P=131;//字符串哈希值结果很大需要对2^64取模
typedef unsigned long long ULL;//unsigned long long 64位
ULL p[N];//p[i]表示P的i次幂,预处理储存起来
ULL h[N];
char str[N];
ULL get(int l,int r){
return h[r]-h[l-1]*p[r-l+1];
}
int main(){
int n,m;
cin>>n>>m;
// for(int i=1;i<=n;i++){
// cin>>str[i];
// }
cin>>str+1;
p[0]=1;
//不能映射成0,所以哈希表数组是从下标1开始的
for(int i=1;i<=n;i++){
p[i]=p[i-1]*P;
h[i]=h[i-1]*P+str[i]; //小写字母97-122
}
int l1,r1,l2,r2;
while(m--){
cin>>l1>>r1>>l2>>r2;
if(get(l1,r1)==get(l2,r2))cout<<"Yes"<<endl;
else cout<<"No"<<endl;
}
return 0;
}