[POJ 1743]Musical Theme(后缀数组)

题目链接

http://poj.org/problem?id=1743

题目大意

给出一个序列,要在它的差分序列中找两个完全相同且互不重叠的子串,求这样的子串的最大长度。

思路

不妨设差分后的序列长度为 n
可以考虑二分这个子串的长度,问题变成判定原序列中是否存在长度为 k 的两个完全相同且互不重叠的子串。
我们可以在 height 数组中找出若干个连续的区间段 [Li,Ri] ,对于任意的 j 属于 [Li,Ri] , height[j]>=k 。显然对于每个连续区间段而言,其中的任意两个后缀的LCP都 >=k ,即存在相同的长度大于等于 k 的前缀。若 RiLi>=k ,则说明后缀 Li 和后缀 Ri 是不重叠的,那么就能找到长度为 k 的两个完全相同且互不重叠的子串。

代码

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <algorithm>

#define MAXN 21000
#define INF 0x3f3f3f3f

using namespace std;

int sa[MAXN],rank[MAXN],height[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],cnt[MAXN];

bool cmp(int *r,int a,int b,int c)
{
    return (r[a]==r[b])&&(r[a+c]==r[b+c]);
}

void SA(int *r,int n,int m)
{
    int i,j,p;
    int *x=wa,*y=wb;
    for(i=0;i<m;i++) cnt[i]=0;
    for(i=0;i<n;i++) cnt[(x[i]=r[i])]++;
    for(i=1;i<m;i++) cnt[i]+=cnt[i-1];
    for(i=n-1;i>=0;i--) sa[--cnt[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) cnt[i]=0;
        for(i=0;i<n;i++) cnt[wv[i]]++; //!!!!!!
        for(i=1;i<m;i++) cnt[i]+=cnt[i-1];
        for(i=n-1;i>=0;i--) sa[--cnt[wv[i]]]=y[i];
        swap(x,y);
        for(p=1,x[sa[0]]=0,i=1;i<n;i++) //!!!!!!
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

void calc(int *r,int n)
{
    int i,j,k=0;
    for(i=1;i<=n;i++) rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}

int n,num[MAXN];

int main()
{
    while(scanf("%d",&n)!=EOF&&n)
    {
        for(int i=0;i<n;i++) scanf("%d",&num[i]);
        for(int i=0;i<n-1;i++) num[i]=num[i+1]-num[i]+100;
        num[--n]=0;
        SA(num,n+1,400);
        calc(num,n);
        int ans=0,lowerBound=1,upperBound=n+1;
        bool flag=false;
        while(lowerBound<=upperBound)
        {
            int mid=(lowerBound+upperBound)>>1;
            int L=INF,R=-INF;
            flag=false; //flag=true表明存在某段区间[L,R],其中的height均>=mid,且sa[R]-sa[L]>=mid+1
            for(int i=1;i<=n;i++)
            {
                if(height[i]>=mid)
                {
                    L=min(L,sa[i]);
                    L=min(L,sa[i-1]);
                    R=max(R,sa[i]);
                    R=max(R,sa[i-1]);
                }
                else
                {
                    if(L+mid<=R) flag=true;
                    L=INF,R=-INF;
                }
            }
            if(L+mid<=R) flag=true;
            if(flag) { ans=mid; lowerBound=mid+1; }
            else upperBound=mid-1;
        }
        if(ans+1>=5) printf("%d\n",ans+1);
        else printf("0\n");
    }
    return 0;
}

你可能感兴趣的:([POJ 1743]Musical Theme(后缀数组))