[SPOJ694 Distinct Substrings]

[关键字]:后缀数组 字符串

[题目大意]:给定一个字符串,求不相同的子串的个数。

//=======================================================================

[分析]:如果所有的后缀按照suffix(sa[1]), suffix(sa[2]),suffix(sa[3]), ……,suffix(sa[n])的顺序计算,不难发现,对于每一次新加进来的后缀suffix(sa[k]),它将产生n-sa[k]+1 个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以suffix(sa[k])将“贡献”出n-sa[k]+1- height[k]个不同的子串。

[代码]:

View Code
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
using namespace std;

const int MAXN=2010;

int test,n;
char s[MAXN];
int top[MAXN],temp[MAXN],sa[MAXN],rank[MAXN],height[MAXN];

void Make()
{
int i,j,len,m;
memset(top,0,sizeof(top));
m=n<256?256:n;
for (i=0;i<n;++i) ++top[rank[i]=s[i]&0xff];
for (i=1;i<m;++i) top[i]+=top[i-1];
for (i=0;i<n;++i) sa[--top[rank[i]]]=i;
for (len=1;len<n;len<<=1)
{
for (i=0;i<n;++i)
{
j=sa[i]-len;
if (j<0) j+=n;
temp[top[rank[j]]++]=j;
}
sa[temp[top[0]=0]]=j=0;
for (i=1;i<n;++i)
{
if (rank[temp[i]]!=rank[temp[i-1]] ||
rank[temp[i]+len]!=rank[temp[i-1]+len])
top[++j]=i;
sa[temp[i]]=j;
}
memcpy(rank,sa,sizeof(sa));
memcpy(sa,temp,sizeof(sa));
if (j>n-1) break;
}
}

void Lcp()
{
int i,j,k;
for (j=rank[height[i=k=0]=0];i<n-1;++i,++k)
while (k>=0 && s[i]!=s[sa[j-1]+k])
height[j]=k--,j=rank[sa[j]+1];
}

void Solve()
{
int sum=n-sa[1]-1;
for (int i=2;i<n;++i)
sum+=n-sa[i]-1-height[i];
printf("%d\n",sum);
}

int main()
{
freopen("in.txt","r",stdin);
freopen("out.txt","w",stdout);
scanf("%d",&test);
while (test--)
{
scanf("%s",s);
n=strlen(s);
s[n++]='$';
Make();
Lcp();
//for (int i=0;i<n;++i) printf("%d ",height[i]);
//printf("\n");
Solve();
}
return 0;
}



你可能感兴趣的:(substring)