hdu 1403 Longest Common Substring 后缀数组da算法

/* *suffix array *倍增算法 O(n*logn) *待排序数组长度为n,放在0~n-1中,在最后面补一个0 *da(str ,n+1,sa,rank,height, , );//注意是n+1; *例如: *n = 8; *num[] = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0 *rank[] = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };rank[0~n-1]为有效值,rank[n]必定为0无效值 *sa[] = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值 *height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值 * */
#include <stdio.h>
#include <string.h>
#include<algorithm>
using namespace std;
const int MAXN=200000+10;
int t1[MAXN],t2[MAXN],c[MAXN];//求SA数组需要的中间变量,不需要赋值
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
//函数结束以后结果放在sa数组中
bool cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}

int da(int str[],int sa[],int rank1[],int height[],int n,int m,int len1)
{
    n++;
    int i,j,p,*x=t1,*y=t2,ans=0;
    //第一轮基数排序,如果s的最大值很大,可改为快速排序
    for(i=0;i<m;i++) c[i]=0;
    for(i=0;i<n;i++) c[x[i]=str[i]]++;
    for(i=1;i<m;i++) c[i]+=c[i-1];
    for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1)
    {
        p=0;
        //直接利用sa数组排序第二关键字
        for(i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        //这样数组y保存的就是按照第二关键字排序的结果
        //基数排序第一关键字
        for(i=0;i<m;i++) c[i]=0;//后面的j个数第二关键字为空的最小
        for(i=0;i<n;i++) c[x[y[i]]]++;
        for(i=1;i<m;i++) c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
        //根据sa和x数组计算新的x数组
        swap(x,y);
        p=1;x[sa[0]]=0;
        for(i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p>=n) break;
        m=p;//下次基数排序的最大值
    }
    int k=0;
    n--;
    for(i=0;i<=n;i++)
        rank1[sa[i]]=i;
    for(i=0;i<n;i++)
    {
        if(k) k--;
        j=sa[rank1[i]-1];
        while(str[i+k]==str[j+k]) k++;
        height[rank1[i]]=k;

        if(height[rank1[i]]>ans)
            {
               //printf("%d %d\n",sa[i],sa[i-1]);
                if(sa[rank1[i]]>len1&&sa[rank1[i]-1]<len1)
                    ans=height[rank1[i]];
                else if(sa[rank1[i]]<len1&&sa[rank1[i]-1]>len1)
                    ans=height[rank1[i]];
            }
    }
    return ans;
}

char s1[MAXN],s2[MAXN];
int ch[MAXN];
int sa[MAXN];
int rank1[MAXN];
int height[MAXN];
int main()
{
    int i,len1,len2;
    while(~scanf("%s",s1))
    {
        scanf("%s",s2);
        len1=strlen(s1);
        len2=strlen(s2);
        for(i=0; i<len1; i++)
            ch[i]=s1[i];
        ch[len1]=0;
        for(i=0; i<len2; i++)
            ch[len1+i]=s2[i];
        ch[len1+len2]=0;
        int ans=da(ch,sa,rank1,height,len1+len2+1,128,len1);
        printf("%d\n",ans);
    }
    return 0;
}

你可能感兴趣的:(hdu 1403 Longest Common Substring 后缀数组da算法)