POJ 3415 Common Substrings(后缀数组)

题目链接:http://poj.org/problem?id=3415

题意:给定两个字符串A和B以及整数K,求长度不小于K的公共字串的个数。

思路:拼接在一起,求sa和height数组。然后就是统计。每遇到一个B的后缀就统计与A的后缀能产生多少长度不小于K的公共子串,每遇到一个A的后缀就统计与B的后缀能产生多少长度不小于K的公共子串。

POJ 3415 Common Substrings(后缀数组)

设A串为aabbaaa,B串为aaa,中间用美元符号隔开,最后求出的后缀和height数组的值如上图所示。统计时分两步:(我们假设此时K=2)

(1)每遇到一个B的后缀统计与之前的A的后缀能形成多少个:在上图中,当扫描到第6行时出现一个B的后缀aaa,可以前面一个A的后缀aa$aaa形成一个大于等于K=2的公共子串,ans=1;

(2)每遇到一个A的后缀统计与之前的B的后缀能形成多少个:在上图中,第一次遇到是第五行aa$aaa,可以与上面一个B的后缀aa形成一个,ans=2;接着到第七行又出现A的一个后缀aaa$aaa,可以与第四行的aa形成一个,ans=3,可以与第六行的aaa形成两个,ans=5(注意,每次形成时是从前向后,所以第七行的A的aaa与第六行的B的aaa形成的是A的前两个和B的前两个以及A的前三个与B的前三个);接着到第八行又出现A的一个后缀aabbaaa$aaa,可以与第四行的aa形成一个,ans=6,可以与第六行的aaa形成一个,ans=7。所以,最后的答案就是7。







int r[N],sa[N],wa[N],wb[N],wd[N],rank[N],h[N];





int cmp(int *r,int a,int b,int L)

{

    return r[a]==r[b]&&r[a+L]==r[b+L];

}





void da(int *r,int *sa,int n,int m)

{

    int i,j,p,*x=wa,*y=wb,*t;

    FOR0(i,m) wd[i]=0;

    FOR0(i,n) wd[x[i]=r[i]]++;

    FOR1(i,m-1) wd[i]+=wd[i-1];

    FORL0(i,n-1) sa[--wd[x[i]]]=i;

    for(j=1,p=1;p<n;j<<=1,m=p)

    {

        p=0;

        FOR(i,n-j,n-1) y[p++]=i;

        FOR0(i,n) if(sa[i]>=j) y[p++]=sa[i]-j;

        FOR0(i,m) wd[i]=0;

        FOR0(i,n) wd[x[i]]++;

        FOR1(i,m-1) wd[i]+=wd[i-1];

        FORL0(i,n-1) sa[--wd[x[y[i]]]]=y[i];

        t=x;x=y;y=t;p=1;x[sa[0]]=0;

        FOR1(i,n-1) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;

    }

}







void calHeight(int *r,int *sa,int n)

{

    int i,j,k=0;

    FOR1(i,n) rank[sa[i]]=i;

    FOR0(i,n)

    {

        if(k) k--;

        j=sa[rank[i]-1];

        while(i+k<n&&j+k<n&&r[i+k]==r[j+k]) k++;

        h[rank[i]]=k;

    }

}





int n;

char s1[N],s2[N];





struct node

{

    i64 len,num;



    node(){}

    node(i64 _len,i64 _num)

    {

        len=_len;

        num=_num;

    }

};



node st[N];

int top;



int K;





i64 deal(int M,int flag)

{

    i64 ans=0,t=0,x,i;

    node p;



    top=-1;

    FOR1(i,M)

    {

        if(h[i]<K)

        {

            t=0,top=-1;

            continue;

        }

        if(flag==0&&sa[i-1]<n||flag==1&&sa[i-1]>n) x=1,t+=h[i]-K+1;

        else x=0;

        while(top>=0&&h[i]<=st[top].len)

        {

            p=st[top--];

            t-=p.num*(p.len-K+1);

            t+=p.num*(h[i]-K+1);

            x+=p.num;

        }

        st[++top]=node(h[i],x);

        if(flag==0&&sa[i]>n||flag==1&&sa[i]<n) ans+=t;

    }

    return ans;

}







int main()

{

    while(scanf("%d",&K),K)

    {

        RD(s1);

        RD(s2);

        n=strlen(s1);

        s1[n]='$';

        s1[n+1]=0;

        strcat(s1,s2);

        int i,M=strlen(s1);

        FOR0(i,M) r[i]=s1[i];

        r[M]=0;

        da(r,sa,M+1,130);

        calHeight(r,sa,M);

        PR(deal(M,0)+deal(M,1));

    }

    return 0;

}

  

你可能感兴趣的:(substring)