[POJ 2774]Long Long Message(后缀数组)

题目链接

http://poj.org/problem?id=2774

题目大意

求两个字符串 ab 的最长公共子串

思路

我们可以把 b 串拼到 a 串后面,中间插入一个从未出现过的分割符(比如$、#之类的),那么这个新串中任意两个后缀的LCP
具体做法可以参考《后缀数组——处理字符串的有力工具》,通过找规律可以发现,对于任意的 i>1,height[i] 的值有可能是a串里两个后缀的LCP值、b串里两个后缀的LCP值、两个串的某个公共子串长度,那么我们可以求出在所有的 i ( sa[i1] sa[i] 对应的下标分属两个串)中最大的 height[i] 即为答案。

一个更好的证明:我们要找的就是一个点对 (i,j) ,使得新串里后缀 i 与后缀 j 的LCP最大,且 i j 不在原来的同一个串里。两个后缀 i,j 的LCP就是 min{height[k]},i<=k<=j ,暴力做法是先枚举 (i,j) 然后求它们的LCP。这样做就牺牲了SA优越的 O(nlogn) 复杂度。更好的做法是枚举 height[i] ,则 height[i] sa[i1]sa[i] 的LCP,如果sa[i-1]和sa[i]是同一个串的话,那么 height[i] 就不能拿来更新答案了。

代码

#include <iostream>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <algorithm>

#define MAXN 1111000

using namespace std;

int sa[MAXN],rank[MAXN],height[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],cnt[MAXN];

bool cmp(int *r,int a,int b,int c)
{
    return (r[a]==r[b])&&(r[a+c]==r[b+c]);
}

void SA(int *r,int n,int m)
{
    int i,j,p;
    int *x=wa,*y=wb;
    for(i=0;i<m;i++) cnt[i]=0;
    for(i=0;i<n;i++) cnt[(x[i]=r[i])]++;
    for(i=1;i<m;i++) cnt[i]+=cnt[i-1];
    for(i=n-1;i>=0;i--) sa[--cnt[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) cnt[i]=0;
        for(i=0;i<n;i++) cnt[wv[i]]++;
        for(i=1;i<m;i++) cnt[i]+=cnt[i-1];
        for(i=n-1;i>=0;i--) sa[--cnt[wv[i]]]=y[i];
        swap(x,y);
        for(p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

void calc(int *r,int n)
{
    int i,j,k=0;
    for(i=1;i<=n;i++) rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++); //!!!!!
}

char a[MAXN],b[MAXN];
int num[MAXN];

int main()
{
    scanf("%s",a);
    scanf("%s",b);
    int lena=strlen(a),lenb=strlen(b);
    int n=lena;
    a[n++]='$';
    for(int i=0;i<lenb;i++) a[n++]=b[i];
    for(int i=0;i<n;i++) num[i]=a[i];
    SA(num,n+1,300);
    calc(num,n);
    int maxans=0;
    for(int i=2;i<=n;i++)
        if(height[i]>=maxans)
        {
            if(0<=sa[i-1]&&sa[i-1]<lena&&lena+1<=sa[i])
                maxans=height[i];
            if(0<=sa[i]&&sa[i]<lena&&lena+1<=sa[i-1])
                maxans=height[i];
        }
    printf("%d\n",maxans);
    return 0;
}

你可能感兴趣的:([POJ 2774]Long Long Message(后缀数组))