后缀数组真难,QAQ
自己写了一个,找了两份模板
主流两种算法:
倍增法(时间O(NlogN),空间O(N))
DC3算法(( 时间复杂度O(N),空间复杂度O(3N) ))
倍增(DA)算法1:
const int MAXN = 1e5+5;
int SA[MAXN], rank[MAXN], Height[MAXN];
int tax[MAXN], tp[MAXN], a[MAXN], n, m; //n为字符串长度,m为ascii码最值多一点;
char str[MAXN];
//rank[i] 第i个后缀的排名; SA[i] 排名为i的后缀位置; Height[i] 排名为i的后缀与排名为(i-1)的后缀的LCP(最长公共前缀)
//tax[i] 计数排序辅助数组; tp[i] rank的辅助数组(计数排序中的第二关键字),与SA意义一样。
//a为原串
void init(){
n = strlen(str);
m = 130; //一开始是以单个字符为单位,所以(m = 130)
for(int i=0;i=1;i--) SA[tax[rank[tp[i]]]--] = tp[i];
}
int cmp(int *f, int x, int y, int w) { return f[x] == f[y] && f[x + w] == f[y + w]; }
//通过二元组两个下标的比较,确定两个子串是否相同
void calheight(){
int j, k = 0;
for(int i = 1; i <= n; Height[rank[i ++]] = k)
for( k = k ? k - 1 : k, j = SA[rank[i] - 1]; a[i + k] == a[j + k]; ++ k);
}
void DA(){
init();
Rsort();
for(int j=1,p=1,i;pj) tp[++p] = SA[i]-j; //长度越界,第二关键字为0
//更新SA值,并用tp暂时存下上一轮的rank(用于cmp比较)
Rsort();
swap(rank,tp);
rank[SA[1]]= p = 1;
for(i=2;i<=n;i++)
rank[SA[i]] = cmp(tp,SA[i],SA[i-1],j)?p:++p;
}
calheight();
}
倍增(DA)算法2:
/* str[]为当前长度为len的字符串,数组下标从1开始
suffix[i]表示从字符串中的下标为i的字符到最后一个字符形成的子串。
比如abcdab suffix[3]=cdab;
suffix[4]=dab;
Rank数组储存后缀按照字典序从小到大的排名。
Rank[i]表示suffix[i]的后缀排名
比如bbbba Rank[5]=1;表示从第五个字符开始的后缀排名第一(最小)
sa[i]表示排名为i的后缀的下标(排名为i的后缀的首字母),和RANK数组为逆运算(sa已知排名求位置,RANK知道位置求排名)
比如bbbba sa[1]=5;
height[i]表示 排名为i的后缀和排名为i-1的后缀的最长公共前缀的长度
比如aaaaa 排名为3的后缀为aaa,排名为2的后缀为aa
所以height[3]=2;*/
#include
#include
#include
#include
typedef long long ll;
using namespace std;
const int MAXN=200010;
int wa[MAXN],wb[MAXN],wv[MAXN],Ws[MAXN];
char str[MAXN];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(const char r[],int sa[],int n,int m) //n为len+1,m一般比数组中最大的数大一点即可
{
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i=0; i--) sa[--Ws[x[i]]]=i;
for(j=1,p=1; p=j) y[p++]=sa[i]-j;
for(i=0; i=0; i--) sa[--Ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i=1;--i) ++sa[i],Rank[i]=Rank[i-1];
}
int main()
{
int t,len;
scanf("%d",&t);
while(t--)
{
scanf("%s",str);
len=strlen(str);
da(str,sa,len+1,130);
calheight(str,sa,len);
ll ans=(long long)len*(len+1)/2;
for(int i=2;i<=len;i++)
{
ans-=height[i];
}
printf("%lld\n",ans);
}
return 0;
}
DC3算法:
#include
#include
#include
#include
#define maxn 1000003
#define F(x) ((x)/3+((x)%3==1?0:tb))
#define G(x) ((x)=0;i--) b[--WS[wv[i]]]=a[i];
return;
}
void dc3(int *r,int *sa,int n,int m)
{
int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;
r[n]=r[n+1]=0;
for(i=0;ib) {t=a;a=b;b=t;}
return(height[askRMQ(a+1,b)]);
}
char c[maxn];
struct pi{
int x;
int y;
}pp[maxn];
int main()
{
int i,j,len,m,p,k,le,ri,mid,minn;
while(scanf("%s",c)!=EOF){
if(c[0]=='.')
break;
len=strlen(c);
minn=len;
for(i=0;i