acwing算法基础之数据结构--哈希表算法

目录

  • 1 基础知识
  • 2 模板
  • 3 工程化

1 基础知识

此部分知识点对应C++标准库中的unordered_set

哈希表:将一个大范围[-1e9,1e9]映射成一个小范围[0,1e6],将此映射记作 f ( ⋅ ) f(\cdot) f()。注意,当出现 x 1 ≠ x 2   a n d   f ( x 1 ) = f ( x 2 ) x_1\neq x_2 \ and \ f(x_1)=f(x_2) x1=x2 and f(x1)=f(x2),也即哈希冲突时,会有两种处理方式。

  1. 拉链法。需要开N个空间。
  2. 开放寻址法。需要开2N~3N个空间。

而映射 f ( ⋅ ) f(\cdot) f()一般这样构造, f ( x ) = ( x % N + N ) % N f(x)=(x \% N + N) \% N f(x)=(x%N+N)%N,其中 N N N一般设置成一个质数,且尽量离2的整数幂远一些。通过上述映射,就将大范围映射到小范围 [ 0 , N − 1 ] [0,N-1] [0,N1]

字符串哈希适用场景:快速判断这两个字符串是否相等。

而对于字符串哈希,一般有两个参数,一个是P进制,二是模数N。P一般取131或13331,而N取2^64,也即unsigned long long int的最大值+1。

2 模板

一般哈希,

(1) 拉链法
    int h[N], e[N], ne[N], idx;

    // 向哈希表中插入一个数
    void insert(int x)
    {
        int k = (x % N + N) % N;
        e[idx] = x;
        ne[idx] = h[k];
        h[k] = idx ++ ;
    }

    // 在哈希表中查询某个数是否存在
    bool find(int x)
    {
        int k = (x % N + N) % N;
        for (int i = h[k]; i != -1; i = ne[i])
            if (e[i] == x)
                return true;

        return false;
    }

(2) 开放寻址法
    int h[N];

    // 如果x在哈希表中,返回x的下标;如果x不在哈希表中,返回x应该插入的位置
    int find(int x)
    {
        int t = (x % N + N) % N;
        while (h[t] != null && h[t] != x)
        {
            t ++ ;
            if (t == N) t = 0;
        }
        return t;
    }

字符串哈希,

核心思想:将字符串看成P进制数,P的经验值是13113331,取这两个值的冲突概率低
小技巧:取模的数用2^64,这样直接用unsigned long long存储,溢出的结果就是取模的结果

typedef unsigned long long ULL;
ULL h[N], p[N]; // h[k]存储字符串前k个字母的哈希值, p[k]存储 P^k mod 2^64

// 初始化
p[0] = 1;
for (int i = 1; i <= n; i ++ )
{
    h[i] = h[i - 1] * P + str[i];
    p[i] = p[i - 1] * P;
}

// 计算子串 str[l ~ r] 的哈希值
ULL get(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}

3 工程化

字符串哈希示例代码,

#include 
#include 

using namespace std;

const int N = 1e5 + 10, P = 131;
unsigned long long int h[N], p[N];
char str[N];

unsigned long long int get(int l, int r) {
    return h[r] - h[l - 1] * p[r - l + 1];
}

int main() {
    int n, m;
    cin >> n >> m;
    cin >> str + 1;
    
    p[0] = 1;
    for (int i = 1; i <= n; ++i) {
        p[i] = p[i-1] * P;
        h[i] = h[i-1] * P + str[i];
    }
    
    
    int l1, r1, l2, r2;
    while (m--) {
        cin >> l1 >> r1 >> l2 >> r2;
        if (get(l1, r1) == get(l2, r2)) {
            puts("Yes");
        } else {
            puts("No");
        }
    }
    return 0;
}

你可能感兴趣的:(Acwing,C++学习,算法,数据结构,散列表)