SPOJ 694 Distinct Substrings(后缀数组)

题目链接:http://www.spoj.com/problems/DISUBSTR/

题意:给定一个串,求不同的字串的个数。

思路:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。如果所有的后缀按照suffix(sa[1]), suffix(sa[2]),suffix(sa[3]),……,suffix(sa[n])的顺序计算,不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以suffix(sa[k])将“贡献”出n-sa[k]+1-height[k]个不同的子串。累加后便是原问题的答案。

 







int r[N],sa[N],wa[N],wb[N],wd[N],rank[N],h[N];





int cmp(int *r,int a,int b,int L)

{

    return r[a]==r[b]&&r[a+L]==r[b+L];

}





void da(int *r,int *sa,int n,int m)

{

    int i,j,p,*x=wa,*y=wb,*t;

    FOR0(i,m) wd[i]=0;

    FOR0(i,n) wd[x[i]=r[i]]++;

    FOR1(i,m-1) wd[i]+=wd[i-1];

    FORL0(i,n-1) sa[--wd[x[i]]]=i;

    for(j=1,p=1;p<n;j<<=1,m=p)

    {

        p=0;

        FOR(i,n-j,n-1) y[p++]=i;

        FOR0(i,n) if(sa[i]>=j) y[p++]=sa[i]-j;

        FOR0(i,m) wd[i]=0;

        FOR0(i,n) wd[x[i]]++;

        FOR1(i,m-1) wd[i]+=wd[i-1];

        FORL0(i,n-1) sa[--wd[x[y[i]]]]=y[i];

        t=x;x=y;y=t;p=1;x[sa[0]]=0;

        FOR1(i,n-1) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;

    }

}







void calHeight(int *r,int *sa,int n)

{

    int i,j,k=0;

    FOR1(i,n) rank[sa[i]]=i;

    FOR0(i,n)

    {

        if(k) k--;

        j=sa[rank[i]-1];

        while(i+k<n&&j+k<n&&r[i+k]==r[j+k]) k++;

        h[rank[i]]=k;

    }

}





int n;

char str[1005];



int main()

{

    int C;

    RD(C);

    while(C--)

    {

        RD(str);

        n=strlen(str);

        int i;

        FOR0(i,n) r[i]=str[i];

        r[n]=0;

        da(r,sa,n+1,150);

        calHeight(r,sa,n);

        int ans=(n+1)*n/2;

        FOR1(i,n) ans-=h[i];

        PR(ans);

    }

    return 0;

}

 

  

 

你可能感兴趣的:(substring)