poj 3415 Common Substrings (后缀数组应用)

题意:

给出两个串,求着两个串的公共子序列至少是k长度的个位数(允许重复)

题解:

先是看了国家队论文得到了点启示,然后具体是想出处理的办法,但是操作起来各种不顺,之后参照了别人的代码,了解到了一种和我做法一样的处理方法。

启示这题相当于贪心,对于任意两个后缀(分别是A串和B串的),对于这两个后缀,如果最长前缀是L,那么要得到至少是k的长度那么L>=k,于是很容易可以看出这个两个后缀为整个答案贡献了L-k+1个。那么就是枚举两个的后缀,先然后超市。其实可以考究后缀之间的关系,我们可以将两个串拼接,中间用一个分隔符号分开。跑一边后缀数组,那么就是对于任意的一下两种情况求和:

1、任意的A后缀和A之前的B后缀L-k+1

2、任意的B后缀和B之前的B后缀L-k+1

我们用单调的数组来优化时间,整个要维护一个单调增的数组,我们要将之前所有非A,或非B的对应L-k+1的和计算出来,假设现在取到的是最优解,sum先加,如果发现单调数组的结尾小破坏了单调增,说明这个解不是最优,加了累赘的一些值,所以不断while(Stack[top-1]>Stack[top])执行操作,这样不断将累赘的值减掉。这个过程不好描素,最好能在纸上计算一些实例便可以发现规律。

#include<iostream>
#include<math.h>
#include<stdio.h>
#include<algorithm>
#include<string.h>
#include<vector>
#include<queue>
#include<map>
#include<set>
using namespace std;
#define B(x) (1<<(x))
typedef long long ll;
const int oo=0x3f3f3f3f;
const ll OO=1LL<<61;
const int MOD=10007;
const int maxn=200005;
int rank[maxn],SA[maxn],height[maxn];
int t1[maxn],t2[maxn],t3[maxn],t4[maxn];
char str[maxn];
int Stack[maxn],num[maxn],is[maxn];

void Swap(int*& x,int*& y){

    int *temp=x;
    x=y;
    y=temp;
}

int cmp(int t[],int a,int b,int l){

    return t[a]==t[b]&&t[a+l]==t[b+l];
}

void build_SA(char s[],int len,int up){

    int *k1=t1,*k2=t2,*r=t3,*cnt=t4;
    for(int i=0;i<up;i++)cnt[i]=0;
    for(int i=0;i<len;i++)cnt[k1[i]=s[i]]++;
    for(int i=1;i<up;i++)cnt[i]+=cnt[i-1];
    for(int i=len-1;i>=0;i--)SA[--cnt[k1[i]]]=i;

    for(int d=1,p=1;p<len;d<<=1,up=p){

        p=0;
        for(int i=len-d;i<len;i++)k2[p++]=i;
        for(int i=0;i<len;i++)if(SA[i]>=d)k2[p++]=SA[i]-d;
        for(int i=0;i<len;i++)r[i]=k1[k2[i]];

        for(int i=0;i<up;i++)cnt[i]=0;
        for(int i=0;i<len;i++)cnt[r[i]]++;
        for(int i=1;i<up;i++)cnt[i]+=cnt[i-1];
        for(int i=len-1;i>=0;i--)SA[--cnt[r[i]]]=k2[i];

        Swap(k1,k2);
        k1[SA[0]]=0;
        p=1;
        for(int i=1;i<len;i++){
            k1[SA[i]]= cmp(k2,SA[i-1],SA[i],d) ? p-1 : p++;
        }
    }
}

void get_height(char s[],int len){

    for(int i=1;i<=len;i++)rank[SA[i]]=i;
    for(int i=0,p=0;i<len;i++){

        int j=SA[rank[i]-1];
        while(s[i+p]==s[j+p])p++;
        height[rank[i]]=p;
        if(p)p--;
    }
}

int main(){

    int k,l1,l2,len,top;
    ll sum,ans;
    while(scanf("%d",&k)!=EOF){
        if(k==0)break;
        scanf("%s",str);
        l1=strlen(str);
        str[l1]='$';
        scanf("%s",str+l1+1);
        l2=strlen(str+l1+1);
        len=l1+l2+1;
        build_SA(str,len+1,130);
        get_height(str,len);
        for(int i=2;i<=len;i++){

            height[i]=max(0,height[i]-k+1);
            is[i]=(SA[i]<l1);
        }
        ans=0;
        Stack[0]=-1;
        for(int f=0;f<2;f++){

            top=sum=0;
            for(int i=2;i<=len;i++){

                Stack[++top]=height[i+1];
                if(is[i]!=f)ans+=sum;///是这个串,加上前面对应另外的串的公共前个数
                if(is[i]==f)num[top]=1;///说明是另外一个串
                else num[top]=0;
                sum+=(ll)Stack[top]*num[top];
                while(top>0&&Stack[top-1]>Stack[top]){

                    sum-=(ll)(Stack[top-1]-Stack[top])*num[top-1];///减去多加的部分
                    Stack[top-1]=Stack[top];
                    num[top-1]+=num[top];
                    top--;
                }//while
            }//for
        }
        printf("%I64d\n",ans);
    }//while
    return 0;
}
/**
*/




你可能感兴趣的:(poj 3415 Common Substrings (后缀数组应用))