小可可是学校图书馆的管理员,现在他接手了一个十分棘手的任务。
由于学校需要一些材料,校长需要在文章中检索一些信息。校长一共给了小可可N篇文章,每篇文章为一个字符串。现在,校长需要他找到这样的单词,它至少在这N篇文章中的M篇文章里出现过,且单词长度为L。可是,工作量十分庞大,但校长又急需小可可完成这项任务。
现在他向你求助,需要你编写程序完成这项艰巨的任务。
很显然,每一个子串可以状压成一个27进制的数,
通过哈希来判断是否有重复。
但是,需要原数,而原数却十分的大,
我们可以通过增加一个取模的数来判断,
这样的错误率就会小很多。
#include
#include
#include
#include
#include
#include
#define N 2003
#define mo 2999999
#define mo1 2997773
using namespace std;
int h[mo+3],h1[mo+3],f[mo+3],g[mo+3];
char s[1003];
int n,m,l,k;
long long ans,n1,n2,ny,z[N],ny1,y[N];
long long hash(long long x)
{
while((h[x]!=0)&&((h[x]!=n1)||(h1[x]!=n2)))
x=(x+1)%mo;
return x;
}
int main()
{
scanf("%d%d%d",&n,&m,&l);
y[0]=z[0]=1;
for(int i=1;i<=l+1;i++)
z[i]=(z[i-1]*27)%mo;
for(int i=1;i<=l+1;i++)
y[i]=(y[i-1]*27)%mo1;
ny=1444444;
ny1=2109544;
for(int i=1;i<=n;i++)
{
scanf("%s",s+1);
if(strlen(s+1)continue;
n1=n2=0;
for(int j=1;j<=l;j++)
{
n1=(n1+z[j-1]*(s[j]-'a'+1))%mo;
n2=(n2+y[j-1]*(s[j]-'a'+1))%mo1;
}
k=hash(n1);
if(h[k]==0)
{
h[k]=n1;
h1[k]=n2;
f[k]=1;
g[k]=i;
if(f[k]==m)ans++;
}
else
{
if(g[k]if(m==f[k])ans++;
}
}
for(int j=l+1;j<=strlen(s+1);j++)
{
n1=(n1-(s[j-l]-'a'+1)+mo)%mo;
n1=(n1*ny)%mo;
n1=(n1+z[l-1]*(s[j]-'a'+1))%mo;
n2=(n2-(s[j-l]-'a'+1)+mo1)%mo1;
n2=(n2*ny1)%mo1;
n2=(n2+y[l-1]*(s[j]-'a'+1))%mo1;
k=hash(n1);
if(h[k]==0)
{
h[k]=n1;
h1[k]=n2;
f[k]=1;
g[k]=i;
if(f[k]==m)ans++;
}
else
{
if(g[k]if(m==f[k])ans++;
}
}
}
}
printf("%lld",ans);
}