fzu 11月赛F (2137) 奇异字符串 后缀数组

      seen喜欢一种特殊的字符串,seen称这种字符串为奇异字符串。奇异字符串可以表示为AxA这种形式,A为一个任意非空字符串,只包含小写字母,x为一个不在A中出现过的小写字母。seen认为一个长度为d的奇异字符串的价值为d*d,不是奇异字符串的字符串没有价值。现给一个只包含小写字母的字符串,统计其所有子串的价值总和。一个字符串的子串是指其中连续的一段字符构成的字符串。这里相同的子串如果在原串中出现的位置不同则视为不同,需要分别进行统计。(照搬题面啦....)

      先预处理下,对每个位置上的字符,找到一个区间【L,R】,在【L,R】中s[i]只出现了一次,(其实就是找一下左右两边离它最近的相同字符啦..),然后枚举中间的字符x,从L开始到x的位置pos 枚举i,若s的后缀suff[k]与suff[i+1]的最长公共前缀大于等于k到i-1的长度,说明这是一个奇异字符串,把他的值加到ans中,枚举x是个26,每次遍历s串是个O(n),然后就是求任意两后缀的LCP了,DIY群里大神们说26*n就可以搞..应该是hash的做法吧,我这写了个后缀数组去求LCP,复杂度是O(26*n*log(n)),10W的数据有点勉强,不过跑了500多ms还是过了...

      

#include <iostream>
#include <cstdio>
#include <algorithm>
#include <string>
#include <cstring>
using namespace std;
typedef long long ll;
const int maxn=210000;
int s[maxn],rs[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn];
int n,m,k,tt;
char s1[maxn];
int rank[maxn],height[maxn];
int l1,l2;
inline int idx(char s)
{
   return s-'a'+1;
}
void getheight(int n)
{
    int i,j,k=0;
    for (i=0; i<=n; i++) rank[sa[i]]=i;
    for (i=0; i<n; i++)
    {
        if (k) k--;
        int j=sa[rank[i]-1];
        while(s[i+k]==s[j+k]) k++;
        height[rank[i]]=k;
    }
}

void build_ss(int m,int n)
{
    n++;
    int i,*x=t,*y=t2;
    for (int i=0; i<m; i++) c[i]=0;
    for (int i=0; i<n; i++) c[x[i]=s[i]]++;
    for (int i=1; i<m; i++) c[i]+=c[i-1];
    for (int i=n-1; i>=0; i--)
      sa[--c[x[i]]]=i;
    for (int k=1; k<=n; k<<=1)
    {
        int p=0;
        for (i=n-k; i<n; i++) y[p++]=i;
        for (i=0; i<n; i++) if (sa[i]>=k) y[p++]=sa[i]-k;

        for (i=0; i<m; i++) c[i]=0;
        for (i=0; i<n; i++) c[x[y[i]]]++;
        for (i=1; i<m; i++) c[i]+=c[i-1];
        for (i=n-1; i>=0; i--) sa[--c[x[y[i]]]] = y[i];
        swap(x,y);
        p=1;
        x[sa[0]]=0;
        for (i=1; i<n; i++)
        x[sa[i]]=(y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k])? p-1 : p++;
        if (p>=n) break;
        m=p;
    }
}
int d[maxn][22];
void RMQ_init()
{
    for (int i=1; i<=n; i++) d[i][0]=height[i];
     for (int j=1; (1<<j)<=n; j++)
      for (int i=1; (i+(1<<j)-1)<=n; i++)
      d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
int RMQ(int L,int R)
{
    int k=0;
    while((1<<(k+1))<=R-L+1) k++;
    return min(d[L][k],d[R-(1<<k)+1][k]);
}
int last[30];
int l[maxn],r[maxn];
int main()
{
//    freopen("in.txt","r",stdin);
    scanf("%d",&tt);
    while(tt--)
    {
        scanf("%s",s1);
        l1=strlen(s1);
        n=l1;
        for (int i=0; i<l1; i++)
        s[i]=idx(s1[i]);
        s[l1]=0;
        memset(last,-1,sizeof last);
        memset(l,0,sizeof l);
        memset(r,0,sizeof r);
        for (int i=0; i<l1; i++)
        l[i]=last[s[i]],last[s[i]]=i;
        memset(last,-1,sizeof last);
        for (int i=l1-1; i>=0; i--)
        r[i]=last[s[i]],last[s[i]]=i;
//        for (int i=0; i<l1; i++)
//        cout<<l[i]<<" "<<r[i]<<endl;
        build_ss(27,l1);
        getheight(l1);
        RMQ_init();
        ll ans=0;
        for (int c=1; c<=26; c++)
        {
            int k1,k2;
            int pos=last[c];
            while(pos>=0)
            {
                int start;
                if (r[pos]>0) start=max(l[pos]+1,pos-(r[pos]-pos-1));
                else start=l[pos]+1;

                for (int i=start; i<pos; i++)
                {
                    k1=min(rank[i],rank[pos+1]);
                    k2=max(rank[i],rank[pos+1]);
                    int tmp=RMQ(k1+1,k2);
                    if (tmp>=pos-i)
                    {
                        ans+=(ll)((pos-i)*2+1)*(ll)((pos-i)*2+1);
                    }
                }
                pos=r[pos];
            }
        }
        cout<<ans<<endl;

    }
    return 0;
}


你可能感兴趣的:(fzu 11月赛F (2137) 奇异字符串 后缀数组)