最长重复子串(后缀数组)

http://ds.bianchengla.com/course/3/practise/problem?id=1387

最长重复子串

时间限制: 1000 ms  |  内存限制: 3000 KB
描述

对于一个字符串S1,其中S2是他的一个子串(长度严格小于S1长度),如果S2S1中出现次数超过1次,那么S2就是一个重复子串,现在的要求是给定S1,请求出他的最长重复子串;

 

如果有多个长度一样的最长子串,请输入字典序最小那个串;

 

比如bbbaaaccc

 

那么最长子串就是aa

输入

第一行包含一个整数T,表示有T组数据

 

对于每组数据包含一行,该行有一个字符串,长度小于10,000

输出

对于每组数据请输出他的最长重复子串,保证每组数据都有;

样例输入
2
abacabac
abacabbac
样例输出
abac
bac
/*  http://ds.bianchengla.com/course/3/practise/problem?id=1387  */
#include <stdio.h>
#include <string.h>
const int maxn = 100000;

#define F(x) ((x)/3+((x)%3==1?0:tb))  
#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)   
int wa[maxn],wb[maxn],wv[maxn],ws[maxn],a[maxn],rank[maxn],height[maxn],sa[maxn];   
int c0(int *r,int a,int b)   
{return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2];}   
int c12(int k,int *r,int a,int b)   
{if(k==2) return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1);   
else return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1];}   
void sort(int *r,int *a,int *b,int n,int m)   
{   
    int i;   
    for(i=0;i<n;i++) wv[i]=r[a[i]];   
    for(i=0;i<m;i++) ws[i]=0;   
    for(i=0;i<n;i++) ws[wv[i]]++;   
    for(i=1;i<m;i++) ws[i]+=ws[i-1];   
    for(i=n-1;i>=0;i--) b[--ws[wv[i]]]=a[i];   
    return;   
}   
void dc3(int *r,int *sa,int n,int m)   
{   
    int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;   
    r[n]=r[n+1]=0;   
    for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i;   
    sort(r+2,wa,wb,tbc,m);   
    sort(r+1,wb,wa,tbc,m);   
    sort(r,wa,wb,tbc,m);   
    for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++)   
        rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;   
    if(p<tbc) dc3(rn,san,tbc,p);   
    else for(i=0;i<tbc;i++) san[rn[i]]=i;   
    for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3;   
    if(n%3==1) wb[ta++]=n-1;   
    sort(r,wb,wa,ta,m);   
    for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i;   
    for(i=0,j=0,p=0;i<ta && j<tbc;p++)   
        sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];   
    for(;i<ta;p++) sa[p]=wa[i++];   
    for(;j<tbc;p++) sa[p]=wb[j++];   
    return;   
}   

void calheight(int *r,int *sa,int n)   
{   
    int i,j,k=0;   
    for(i=1;i<=n;i++)rank[sa[i]]=i;   
    for(i=0;i<n;height[rank[i++]]=k)   
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);   
} 

int main()
{
	int t,i,j,len,start,last;
	char str[maxn];
	scanf("%d",&t);
	while (t--)
	{
		scanf("%s",str);
		len = strlen(str);
		for (i=0;i<len;i++)
		{
			a[i] = static_cast<int>(str[i]);
		}
		a[len] = 0;
		dc3(a,sa,len+1,250);
		calheight(a,sa,len);
		start = last = 0;
		for(i=1;i<=len;i++)
		{
			if(last < height[i])
			{
				last = height[i];
				start = sa[i];
			}
		}
		for(i=start,j=0;j<last;j++,i++)
			printf("%c",str[i]);
		printf("/n");
	}
	return 0;
}

 

你可能感兴趣的:(最长重复子串(后缀数组))