字符串哈希就是将一个字符串转换为一个数字进行表示,这样可以用来判断几个字符串是否相同,如何将字符串看做一个数字,这里所介绍的就是:进制哈希,核心思想就是将字符串看成一个固定的base进制数,将字符串每一个字符看做成每一位数,那么这个数就可以看成这个字符串的哈希值。
哈希公式:hash[i]=(hash[i−1]∗Base+s[i])%mod(mod一般为long long 的最大值)(s[i]表示s字符串中s[i]字符的ASCII值)
哈希公式就类型一个数字1234,他表示为1*10^3+2*10^2+3*10^1+4*10^0,只不过是把操作对象改成了字符,字符的ASCII值对应每一位数的数字。
假设有一个 S=s1s2s3s4s5的字符串,根据定义,获取其 Hash值如下(我们先忽略mod,方便理解):
hash[0]=0
hash[1]=s1
hash[2]=s1∗Base+s2
hash[3]=s1∗Base^2+s2∗Base+s3
hash[4]=s1∗Base^3+s2∗Base^2+s3∗Base+s4
hash[5]=s1∗Base^4+s2∗Base^3+s3∗Base^2+s4∗Base+s5
题目描述
如题,给定 N 个字符串(第 i 个字符串长度为 Mi,字符串内包含数字、大小写字母,大小写敏感),请求出 N 个字符串中共有多少个不同的字符串。
友情提醒:如果真的想好好练习哈希的话,请自觉。
输入格式
第一行包含一个整数 N,为字符串的个数。
接下来 N 行每行包含一个字符串,为所提供的字符串。
输出格式
输出包含一行,包含一个整数,为不同的字符串个数。
输入输出样例
输入 #1
5 abc aaaa abc abcc 12345
输出 #1
4
对于 30% 的数据:N≤10,Mi≈6,Mmax≤15。
对于 70% 的数据:N≤1000,Mi≈100,Mmax≤150。
对于 100% 的数据:N≤10000,Mi≈1000,Mmax≤1500。
样例说明:
样例中第一个字符串(abc)和第三个字符串(abc)是一样的,所以所提供字符串的集合为{aaaa,abc,abcc,12345},故共计4个不同的字符串。
Tip: 感兴趣的话,你们可以先看一看以下三题:
BZOJ3097:http://www.lydsy.com/JudgeOnline/problem.php?id=3097
BZOJ3098:http://www.lydsy.com/JudgeOnline/problem.php?id=3098
BZOJ3099:http://www.lydsy.com/JudgeOnline/problem.php?id=3099
如果你仔细研究过了(或者至少仔细看过AC人数的话),我想你一定会明白字符串哈希的正确姿势的^_^
解题思路
根据公式将每个字符串的哈希值求出来,再进行排序,如果前后两个哈希值不相等数量加一,最后输出结果
AC代码
#include
#include
long long a[10001], mod = 9223372036854775807, base = 131, b[10000];
char s[1502];
long long haxi(char s[])//计算字符串哈希函数并返回哈希值
{
int k = strlen(s);
long long ans = 0;
for (int i = 1; i < k; i++)
ans = (ans * base + (long long)s[i]) % mod;
return ans;
}
void nb(long long x, long long y)//归并排序
{
if (x >= y) return;
long long mid = (x + y) / 2, i, j;
nb(x, mid);
nb(mid + 1, y);
int cnt = 0;
for (i = x, j = mid + 1; i <= mid && j <= y;)
{
if (a[i] <= a[j])
b[++cnt] = a[i++];
else
b[++cnt] = a[j++];
}
while (i <= mid)
b[++cnt] = a[i++];
while (j <= y)
b[++cnt] = a[j++];
for (i = 1; i <= cnt; i++)
a[x + i - 1] = b[i];
}
int main()
{
int n, i, j, sum = 1;
scanf("%d", &n);//输入字符串的数量
for (i = 1; i <= n; i++)
{
scanf("%s", s);
a[i] = haxi(s);//计算哈希值并储存
}
nb(1, n);//归并排序
for (i = 1; i < n; i++)//统计不一样的数量
if (a[i] != a[i + 1])
sum++;
printf("%d", sum);
return 0;
}