hdu 4436 后缀数组

某牛的解题思路:

题目大意给出n个字符串,求出所有字符串中出现的不同的整数和mod2012的值(即出现多次算一次)

找出所有的子串然后出重,先用分隔符符将所有串都连接起来,然后跑后缀数组,接下来就是计算。
从计算第i个后缀的时候,显然从i开始的字符串长度
要在i+height[rank[i]]~第i个串的结束位置,因为前面的必然重复了,但也不能超过结束位置。
计算的话就是维护一个部分和,然后把需要减去的剪掉即可。
我程序中维护了一个T数组和V数组。

如1234   T[4]=1+12+123+1234  V[2]=12   计算3+34 = T[4]-T[2]-V[2]*110

/*
题目大意给出n个字符串,求出所有字符串中出现的不同的整数和mod2012的值(即出现多次算一次)
找出所有的子串然后出重,先用分隔符符将所有串都连接起来,然后跑后缀数组,接下来就是计算。
从计算第i个后缀的时候,显然从i开始的字符串长度
要在i+height[rank[i]]~第i个串的结束位置,因为前面的必然重复了,但也不能超过结束位置。
计算的话就是维护一个部分和,然后把需要减去的剪掉即可。
我程序中维护了一个T数组和V数组。
如1234   T[4]=1+12+123+1234  V[2]=12   计算3+34 = T[4]-T[2]-V[2]*110
*/
#include <iostream>
#include <cstring>
#include <cstdio>
using namespace std;
#pragma comment(linker, "/STACK:1024000000,1024000000")
const int MAXN=200000;
const int mod=2012;
int r[MAXN],lcp[MAXN];
int wa[MAXN], wb[MAXN], wv[MAXN], tmp[MAXN];
int sa[MAXN]; //index range 1~n value range 0~n-1
char s[MAXN];
int rank[MAXN]; //index range 0~n-1 value range 1~n
int height[MAXN]; //index from 1   (height[1] = 0)
int P[MAXN],T[MAXN],V[MAXN],Pow[MAXN];
int arrive[MAXN];
int cmp(int *r, int a, int b, int l)
{
    return r[a] == r[b] && r[a + l] == r[b + l];
}
void da(int *r, int *sa, int n, int m)
{
    int i, j, p, *x = wa, *y = wb, *ws = tmp;
    ///对r中长度为1的子串进行基数排序
    for (i = 0; i < m; i++) ws[i] = 0;
    for (i = 0; i < n; i++) ws[x[i] = r[i]]++;
    for (i = 1; i < m; i++) ws[i] += ws[i - 1];
    for (i = n - 1; i >= 0; i--) sa[--ws[x[i]]] = i;
     ///对r中长度为j的子串进行基数排序
    for (j = 1, p = 1; p < n; j *= 2, m = p)
    {
        for (p = 0, i = n - j; i < n; i++) y[p++] = i;
        for (i = 0; i < n; i++)
            if (sa[i] >= j) y[p++] = sa[i] - j;

        for (i = 0; i < n; i++) wv[i] = x[y[i]];
        for (i = 0; i < m; i++) ws[i] = 0;
        for (i = 0; i < n; i++) ws[wv[i]]++;
        for (i = 1; i < m; i++) ws[i] += ws[i - 1];
        for (i = n - 1; i >= 0; i--) sa[--ws[wv[i]]] = y[i];

        for (swap(x, y), p = 1, x[sa[0]] = 0, i = 1; i < n; i++)
            x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
    }
}
void calheight(int *r, int *sa, int n)
{
    int i, j, k = 0;
    for (i = 1; i <= n; ++i) rank[sa[i]] = i;
    for (i = 0; i < n; height[rank[i++]] = k)
        for (k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; ++k);
    return;
}
int get(int l,int r)
{
    if (l>r) return 0;
    int ans=(T[r+1]-T[l]);
    ans%=mod;
    ans-=V[l]*Pow[r-l+1];
    ans%=mod;
    if (ans<0) ans+=mod;
    return ans;
}
int main()
{
   // freopen("//media/学习/ACM/input.txt","r",stdin);
    int t;
    Pow[1]=10;
    int i,j;
    for (i=2;i<200000;i++)
        Pow[i]=(Pow[i-1]+1)*10%mod;
     while (scanf("%d",&t)!=EOF)
     {
         int k=0,val=0,len=0,l;
         for(i=1;i<=t;i++)
         {
             scanf("%s",s);
             l=strlen(s);
             for(j=0;j<l;j++)
             {
                 r[len]=s[j]-'0'+1;
                val=(val*10+r[len]-1)%mod;
                V[len+1]=val;
                T[len+1]=(T[len]+val)%mod;
                P[len]=i;
                len++;
             }
             r[len]=11;
            val=(val*10+10)%mod;
            V[len+1]=val;
            T[len+1]=(T[len]+val)%mod;
            P[len]=i;
            len++;
            arrive[i]=len-2;
        }
        r[len]=0;
        da(r,sa,len+1,12);
        calheight(r,sa,len);
        int ans=0;
        for (i=0;i<len;i++)
        {
            if (r[i]%10!=1)
            {
                if (i+height[rank[i]]<=arrive[P[i]])
                {
                    ans+=get(i,arrive[P[i]])-get(i,i+height[rank[i]]-1);
                    ans%=mod;
                    if (ans<0) ans+=mod;
                }
            }
        }
        printf("%d\n",ans);
     }
       return 0;
}


你可能感兴趣的:(hdu 4436 后缀数组)