题目链接:http://poj.org/problem?id=3415
题意:给定两个字符串A和B以及整数K,求长度不小于K的公共字串的个数。
思路:拼接在一起,求sa和height数组。然后就是统计。每遇到一个B的后缀就统计与A的后缀能产生多少长度不小于K的公共子串,每遇到一个A的后缀就统计与B的后缀能产生多少长度不小于K的公共子串。
设A串为aabbaaa,B串为aaa,中间用美元符号隔开,最后求出的后缀和height数组的值如上图所示。统计时分两步:(我们假设此时K=2)
(1)每遇到一个B的后缀统计与之前的A的后缀能形成多少个:在上图中,当扫描到第6行时出现一个B的后缀aaa,可以前面一个A的后缀aa$aaa形成一个大于等于K=2的公共子串,ans=1;
(2)每遇到一个A的后缀统计与之前的B的后缀能形成多少个:在上图中,第一次遇到是第五行aa$aaa,可以与上面一个B的后缀aa形成一个,ans=2;接着到第七行又出现A的一个后缀aaa$aaa,可以与第四行的aa形成一个,ans=3,可以与第六行的aaa形成两个,ans=5(注意,每次形成时是从前向后,所以第七行的A的aaa与第六行的B的aaa形成的是A的前两个和B的前两个以及A的前三个与B的前三个);接着到第八行又出现A的一个后缀aabbaaa$aaa,可以与第四行的aa形成一个,ans=6,可以与第六行的aaa形成一个,ans=7。所以,最后的答案就是7。
int r[N],sa[N],wa[N],wb[N],wd[N],rank[N],h[N];
int cmp(int *r,int a,int b,int L)
{
return r[a]==r[b]&&r[a+L]==r[b+L];
}
void da(int *r,int *sa,int n,int m)
{
int i,j,p,*x=wa,*y=wb,*t;
FOR0(i,m) wd[i]=0;
FOR0(i,n) wd[x[i]=r[i]]++;
FOR1(i,m-1) wd[i]+=wd[i-1];
FORL0(i,n-1) sa[--wd[x[i]]]=i;
for(j=1,p=1;p<n;j<<=1,m=p)
{
p=0;
FOR(i,n-j,n-1) y[p++]=i;
FOR0(i,n) if(sa[i]>=j) y[p++]=sa[i]-j;
FOR0(i,m) wd[i]=0;
FOR0(i,n) wd[x[i]]++;
FOR1(i,m-1) wd[i]+=wd[i-1];
FORL0(i,n-1) sa[--wd[x[y[i]]]]=y[i];
t=x;x=y;y=t;p=1;x[sa[0]]=0;
FOR1(i,n-1) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
void calHeight(int *r,int *sa,int n)
{
int i,j,k=0;
FOR1(i,n) rank[sa[i]]=i;
FOR0(i,n)
{
if(k) k--;
j=sa[rank[i]-1];
while(i+k<n&&j+k<n&&r[i+k]==r[j+k]) k++;
h[rank[i]]=k;
}
}
int n;
char s1[N],s2[N];
struct node
{
i64 len,num;
node(){}
node(i64 _len,i64 _num)
{
len=_len;
num=_num;
}
};
node st[N];
int top;
int K;
i64 deal(int M,int flag)
{
i64 ans=0,t=0,x,i;
node p;
top=-1;
FOR1(i,M)
{
if(h[i]<K)
{
t=0,top=-1;
continue;
}
if(flag==0&&sa[i-1]<n||flag==1&&sa[i-1]>n) x=1,t+=h[i]-K+1;
else x=0;
while(top>=0&&h[i]<=st[top].len)
{
p=st[top--];
t-=p.num*(p.len-K+1);
t+=p.num*(h[i]-K+1);
x+=p.num;
}
st[++top]=node(h[i],x);
if(flag==0&&sa[i]>n||flag==1&&sa[i]<n) ans+=t;
}
return ans;
}
int main()
{
while(scanf("%d",&K),K)
{
RD(s1);
RD(s2);
n=strlen(s1);
s1[n]='$';
s1[n+1]=0;
strcat(s1,s2);
int i,M=strlen(s1);
FOR0(i,M) r[i]=s1[i];
r[M]=0;
da(r,sa,M+1,130);
calHeight(r,sa,M);
PR(deal(M,0)+deal(M,1));
}
return 0;
}