POJ 2406 后缀数组:求连续重复子串

解法一:DC3求后缀

因为我用的是红书的后缀模板,所以是倍增求的,所以这个DC3是用这个博客的模板:http://www.cnblogs.com/GO-NO-1/p/3480212.html

这个也是勉强过的,时间为:2829ms了,写得不机智就会超了。

#include<stdio.h>
#include<string.h>
#define N 2000005
#define F(x) ((x)/3+((x)%3==1?0:tb))
#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)
int wa[N],wb[N],wv[N],ws[N];
int rank[N],height[N];    
int sa[N],r[N];
char c[N];
int lcp[N]; //记录到height[rank[0]]的最小值 
int Max(int a,int b)
{
    return a>b?a:b;
} 
int Min(int a,int b)
{
    return a<b?a:b;
}
int cmp(int *y,int a,int b,int l)
{
    return y[a]==y[b]&&y[a+l]==y[b+l];   
}

int c0(int *y,int a,int b)
{
    return y[a]==y[b]&&y[a+1]==y[b+1]&&y[a+2]==y[b+2];
}
int c12(int k,int *y,int a,int b)
{
    if(k==2) return y[a]<y[b]||y[a]==y[b]&&c12(1,y,a+1,b+1);
    else return y[a]<y[b]||y[a]==y[b]&&wv[a+1]<wv[b+1];
}
void sort(int *r,int *a,int *b,int n,int m)
{
    int i;
    for(i=0;i<n;i++) wv[i]=r[a[i]];
    for(i=0;i<m;i++) ws[i]=0;
    for(i=0;i<n;i++) ws[wv[i]]++;
    for(i=1;i<m;i++) ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--) b[--ws[wv[i]]]=a[i];
    return;
}
void dc3(int *r,int *sa,int n,int m)
{
    int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;
    r[n]=r[n+1]=0;
    for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i;
    sort(r+2,wa,wb,tbc,m);
    sort(r+1,wb,wa,tbc,m);
    sort(r,wa,wb,tbc,m);
    for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++)
        rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;
    if(p<tbc) dc3(rn,san,tbc,p);
        else for(i=0;i<tbc;i++) san[rn[i]]=i;
    for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3;
    if(n%3==1) wb[ta++]=n-1;
    sort(r,wb,wa,ta,m);
    for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i;
    for(i=0,j=0,p=0;i<ta && j<tbc;p++)
        sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];
    for(;i<ta;p++) sa[p]=wa[i++];
    for(;j<tbc;p++) sa[p]=wb[j++];
    return;
}
void get_height(int n)
{
    int i,j,k=0;
    for(i=0;i<=n;i++) rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
    return; 
}
int main(void)
{
    while(scanf("%s",c)!=EOF)
    {
        if(strcmp(c,".")==0) break;
        int n=strlen(c);
        for(int i=0;i<n;i++)
            r[i]=c[i]+1;
        r[n]=0;
        dc3(r,sa,n+1,256);
        get_height(n);
        //for(int i=0;i<n;i++) printf("%d %d %d\n",i,rank[i],height[i]);
        memset(lcp,0,sizeof(lcp));
        lcp[rank[0]]=N;
        for(int i=rank[0]-1;i>=0;i--) lcp[i]=Min(lcp[i+1],height[i+1]);
        for(int i=rank[0]+1;i<=n;i++) lcp[i]=Min(lcp[i-1],height[i]);
        //for(int i=0;i<=n;i++) printf("%d %d %d\n",rank[i],height[i],lcp[i]);
        for(int k=1;k<=n;k++)  //遍历所有值 
            if(n%k==0 && lcp[rank[k]]==n-k){
                printf("%d\n",n/k);
                break;
            }
    }
    return 0;
}




解法二:倍增算法超时

但是还是把代码贴出来吧,亏我还写了好久,刚开始学的后缀加RMQ的就T了,唉……看discuss说是倍增超时,DC3算法求sa就不超时,没想到还有这种题卡倍增的,刚开始还以为我转换字符串的时候超时呢……

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<map>
#include<queue>
#include<set>
#include<cmath>
#include<bitset>
#define mem(a,b) memset(a,b,sizeof(a))
#define lson i<<1,l,mid
#define rson i<<1|1,mid+1,r
#define llson j<<1,l,mid
#define rrson j<<1|1,mid+1,r
#define INF 0x7fffffff
#define maxn 1000010
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
void radix(int *str,int *a,int *b,int n,int m)
{
    static int count[maxn];
    mem(count,0);
    for(int i=0; i<n; i++) ++count[str[a[i]]];
    for(int i=1; i<=m; i++) count[i]+=count[i-1];
    for(int i=n-1; i>=0; i--) b[--count[str[a[i]]]]=a[i];
}
void suffix(int *str,int *sa,int n,int m) //倍增算法计算出后缀数组sa
{
    static int rank[maxn],a[maxn],b[maxn];
    for(int i=0; i<n; i++) rank[i]=i;
    radix(str,rank,sa,n,m);
    rank[sa[0]]=0;
    for(int i=1; i<n; i++)
        rank[sa[i]]=rank[sa[i-1]]+(str[sa[i]]!=str[sa[i-1]]);
    for(int i=0; 1<<i<n; i++)
    {
        for(int j=0; j<n; j++)
        {
            a[j]=rank[j]+1;
            b[j]=j+(1<<i)>=n?0:rank[j+(1<<i)]+1;
            sa[j]=j;
        }
        radix(b,sa,rank,n,n);
        radix(a,rank,sa,n,n);
        rank[sa[0]]=0;
        for(int j=1; j<n; j++)
            rank[sa[j]]=rank[sa[j-1]]+(a[sa[j-1]]!=a[sa[j]]||b[sa[j-1]]!=b[sa[j]]);
    }
}
void calcHeight(int *str,int *sa,int *h,int *rank,int n) //求出最长公共前缀数组h
{
    int k=0;
    h[0]=0;
    for(int i=0; i<n; i++) rank[sa[i]]=i;
    for(int i=0; i<n; i++)
    {
        k=k==0?0:k-1;
        if(rank[i])
            while(str[i+k]==str[sa[rank[i]-1]+k]) k++;
        else k=0;
        h[rank[i]]=k;
    }
}
int a[maxn],sa[maxn],height[maxn],rank[maxn];
int dp[maxn];
void RMQ(int n)//一维对height数组对rank[0]取最小值
{
    int i,k=rank[0];
    dp[k]=INF;
    for(i=k-1;i>=0;i--)
        dp[i]=min(dp[i+1],height[i+1]);
    for(i=k+1;i<n;i++)
        dp[i]=min(dp[i-1],height[i]);
}
char s[maxn];
int main()
{
    //freopen("test.txt","r",stdin);
    while(scanf("%s",s)&&s[0]!='.')
    {
        int n=strlen(s),i,flag=0;
        for(i=0;i<n;i++) a[i]=s[i];
        suffix(a,sa,n,128);
        calcHeight(a,sa,height,rank,n);
        RMQ(n);
        for(i=1;i<=n/2;i++)
            if(dp[rank[i]]==n-i&&n%i==0)
            {
                flag=1;
                break;
            }
        if(flag) printf("%d\n",n/i);
        else puts("1");
    }
    return 0;
}


你可能感兴趣的:(POJ 2406 后缀数组:求连续重复子串)