JZOJ3870. 【NOIP2014八校联考第4场第1试10.19】单词检索(search)

Description

小可可是学校图书馆的管理员,现在他接手了一个十分棘手的任务。
由于学校需要一些材料,校长需要在文章中检索一些信息。校长一共给了小可可N篇文章,每篇文章为一个字符串。现在,校长需要他找到这样的单词,它至少在这N篇文章中的M篇文章里出现过,且单词长度为L。可是,工作量十分庞大,但校长又急需小可可完成这项任务。
现在他向你求助,需要你编写程序完成这项艰巨的任务。

题解

很显然,每一个子串可以状压成一个27进制的数,
通过哈希来判断是否有重复。
但是,需要原数,而原数却十分的大,
我们可以通过增加一个取模的数来判断,
这样的错误率就会小很多。

code

#include 
#include 
#include 
#include 
#include 
#include  
#define N 2003
#define mo 2999999
#define mo1 2997773
using namespace std;
int h[mo+3],h1[mo+3],f[mo+3],g[mo+3];
char s[1003];
int n,m,l,k;
long long ans,n1,n2,ny,z[N],ny1,y[N];
long long hash(long long x)
{
    while((h[x]!=0)&&((h[x]!=n1)||(h1[x]!=n2)))
        x=(x+1)%mo;
    return x;
}
int main()
{
    scanf("%d%d%d",&n,&m,&l);
    y[0]=z[0]=1;
    for(int i=1;i<=l+1;i++)
        z[i]=(z[i-1]*27)%mo;
    for(int i=1;i<=l+1;i++)
        y[i]=(y[i-1]*27)%mo1;
    ny=1444444;
    ny1=2109544;
    for(int i=1;i<=n;i++)
    {
        scanf("%s",s+1);
        if(strlen(s+1)continue;
        n1=n2=0;
        for(int j=1;j<=l;j++)
        {
            n1=(n1+z[j-1]*(s[j]-'a'+1))%mo;
            n2=(n2+y[j-1]*(s[j]-'a'+1))%mo1;
        }
        k=hash(n1);
        if(h[k]==0)
        {
            h[k]=n1;
            h1[k]=n2;
            f[k]=1;
            g[k]=i;
            if(f[k]==m)ans++;
        }
        else
        {
            if(g[k]if(m==f[k])ans++;
            }
        }
        for(int j=l+1;j<=strlen(s+1);j++)
        {
            n1=(n1-(s[j-l]-'a'+1)+mo)%mo;
            n1=(n1*ny)%mo;
            n1=(n1+z[l-1]*(s[j]-'a'+1))%mo;

            n2=(n2-(s[j-l]-'a'+1)+mo1)%mo1;
            n2=(n2*ny1)%mo1;
            n2=(n2+y[l-1]*(s[j]-'a'+1))%mo1;

            k=hash(n1);
            if(h[k]==0)
            {
                h[k]=n1;
                h1[k]=n2;
                f[k]=1;
                g[k]=i;
                if(f[k]==m)ans++;
            }
            else
            {
                if(g[k]if(m==f[k])ans++;
                }
            }
        }
    }
    printf("%lld",ans);
}

你可能感兴趣的:(题解,hash)