BZOJ3555 企鹅QQ 字符串hash

题目:
Description
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

Input
第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。

Output
仅一行一个正整数,表示共有多少对相似的账户名称。

Sample Input
4 3 64
Fax
fax
max
mac
Sample Output
4
Hint
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64

题意:给出n个长度为定长m的字符串,求解有多少对相似的字符串,两字符串相似的定义为两个字符串有且仅有在某一位上不一样。

题解:字符串哈希,采用ull自然溢出,否则很容易tle,枚举n位,在某一位上,删除这一位的贡献,sort后判断一样的哈希值的数目然后求解对数。

AC代码:

#include
using namespace std;
typedef unsigned long long ull;
typedef long long ll;
const int p=13331;
const int maxn=3e4+5;
ull bit[250];
ull has[maxn];
ull rec[maxn];
int n,m,k;
void init()
{
	bit[0]=1;
	for(int i=1;i<=205;i++)
	{
		bit[i]=bit[i-1]*p;
	}
}
char s[maxn][205];
int main()
{
	init();
	scanf("%d%d%d",&n,&m,&k);
	for(int i=1;i<=n;i++)
	{
		scanf("%s",s[i]+1);
	}
	for(int i=1;i<=n;i++)
	{
		for(int j=1;j<=m;j++)
		{
			has[i]=has[i]*p+s[i][j];
		}
	}
	ll ans=0;
	for(int j=1;j<=m;j++)
	{
		for(int i=1;i<=n;i++)
		{
			rec[i]=has[i]-s[i][j]*bit[m-j];
		}
		sort(rec+1,rec+1+n);
		ull zz=-1;
		ll zzz=1;
		for(int i=1;i<=n;i++)
		{
			if(rec[i]==zz)
			{
				zzz++;
			}
			else
			{
				zzz=zzz*(zzz-1)/2;
				ans+=zzz;
				zzz=1;zz=rec[i];
			}
		}
		zzz=zzz*(zzz-1)/2;
		ans+=zzz;
	}
	printf("%lld\n",ans);
	return 0;
 } 

你可能感兴趣的:(刷题记录,字符串,题解)