字符串哈希

字符串哈希就是将一个字符串转换为一个数字进行表示,这样可以用来判断几个字符串是否相同,如何将字符串看做一个数字,这里所介绍的就是:进制哈希,核心思想就是将字符串看成一个固定的base进制数,将字符串每一个字符看做成每一位数,那么这个数就可以看成这个字符串的哈希值。

哈希公式:hash[i]=(hash[i−1]∗Base+s[i])%mod(mod一般为long long 的最大值)(s[i]表示s字符串中s[i]字符的ASCII值)

哈希公式就类型一个数字1234,他表示为1*10^3+2*10^2+3*10^1+4*10^0,只不过是把操作对象改成了字符,字符的ASCII值对应每一位数的数字。

假设有一个 S=s1s2s3s4s5的字符串,根据定义,获取其 Hash值如下(我们先忽略mod,方便理解):

hash[0]=0

hash[1]=s1

hash[2]=s1∗Base+s2

hash[3]=s1∗Base^2+s2∗Base+s3

hash[4]=s1∗Base^3+s2∗Base^2+s3∗Base+s4

hash[5]=s1∗Base^4+s2∗Base^3+s3∗Base^2+s4∗Base+s5

 题目例子

P3370 【模板】字符串哈希

题目描述

如题,给定 N 个字符串(第 i 个字符串长度为 Mi​,字符串内包含数字、大小写字母,大小写敏感),请求出 N 个字符串中共有多少个不同的字符串。

友情提醒:如果真的想好好练习哈希的话,请自觉。

输入格式

第一行包含一个整数 N,为字符串的个数。

接下来 N 行每行包含一个字符串,为所提供的字符串。

输出格式

输出包含一行,包含一个整数,为不同的字符串个数。

输入输出样例

输入 #1

5
abc
aaaa
abc
abcc
12345

输出 #1

4

说明/提示

对于 30% 的数据:N≤10,Mi​≈6,Mmax≤15。

对于 70% 的数据:N≤1000,Mi​≈100,Mmax≤150。

对于 100% 的数据:N≤10000,Mi​≈1000,Mmax≤1500。

样例说明:

样例中第一个字符串(abc)和第三个字符串(abc)是一样的,所以所提供字符串的集合为{aaaa,abc,abcc,12345},故共计4个不同的字符串。

Tip: 感兴趣的话,你们可以先看一看以下三题:

BZOJ3097:http://www.lydsy.com/JudgeOnline/problem.php?id=3097

BZOJ3098:http://www.lydsy.com/JudgeOnline/problem.php?id=3098

BZOJ3099:http://www.lydsy.com/JudgeOnline/problem.php?id=3099

如果你仔细研究过了(或者至少仔细看过AC人数的话),我想你一定会明白字符串哈希的正确姿势的^_^

 解题思路

根据公式将每个字符串的哈希值求出来,再进行排序,如果前后两个哈希值不相等数量加一,最后输出结果

AC代码

#include
#include
long long a[10001], mod = 9223372036854775807, base = 131, b[10000];
char s[1502];
long long haxi(char s[])//计算字符串哈希函数并返回哈希值
{
	int k = strlen(s);
	long long ans = 0;
	for (int i = 1; i < k; i++)
		ans = (ans * base + (long long)s[i]) % mod;
	return ans;
}
void nb(long long x, long long y)//归并排序
{
    if (x >= y) return;
    long long mid = (x + y) / 2, i, j;
    nb(x, mid);
    nb(mid + 1, y);
    int cnt = 0;
    for (i = x, j = mid + 1; i <= mid && j <= y;)
    {
        if (a[i] <= a[j])
            b[++cnt] = a[i++];
        else
            b[++cnt] = a[j++];
    }
    while (i <= mid)
        b[++cnt] = a[i++];
    while (j <= y)
        b[++cnt] = a[j++];
    for (i = 1; i <= cnt; i++)
        a[x + i - 1] = b[i];
}
int main()
{
	int n, i, j, sum = 1;
	scanf("%d", &n);//输入字符串的数量
	for (i = 1; i <= n; i++)
	{
		scanf("%s", s);
		a[i] = haxi(s);//计算哈希值并储存
	}
    nb(1, n);//归并排序
    for (i = 1; i < n; i++)//统计不一样的数量
        if (a[i] != a[i + 1])
            sum++;
    printf("%d", sum);
	return 0;
}

你可能感兴趣的:(哈希算法,算法)