HDU 4416 Good Article Good sentence(12年杭州 后缀数组)

转载请注明出处,谢谢http://blog.csdn.net/acm_cxlove/article/details/7854526       by---cxlove 

题目:给出一个A串,给出若干个B串,问A串中有多少个不同的子串不是B中的子串

http://acm.hdu.edu.cn/showproblem.php?pid=4416 

比赛中挺可惜的一题。
当时看了一下数据范围,A串为10W,看了一下Clarification,有10W的B串,但是题目说的是B串的长度总和不超过10W,我以为是每一个B串不超过10W。当时就吓尿了,果断放弃了

其实这种子串问题,比较明显是后缀数组,但是当时的数据让我没办法把所有的串拼接在一起。哎~~~~

将所有的串拼接在一起,中间用一个不同的字符分隔开。然后求一次后缀数组以及height数组。

然后对于A中的某一个后缀,统计一下有B中的LCA有多少,就OK了,说明有A的这个后缀有LCA个子串在B中出现过。

只需要从前往后以及从后往前统计一次height就OK了。注意我们这里统计的是A与B的LCA。如果连续的两个sa是A中,那我们需要求一次最小值,保证求的是和B串的LCA。

但是题目要求的是A中的不同的子串,所以还要去重,遍历一次,如果连续两个都是A串的,则更新一下

#include<iostream>
#include<cstdio>
#include<map>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
#include<set>
#include<string>
#include<queue>
#define inf 1<<28
#define M 6000005
#define N 1000005
#define maxn 300005
#define Min(a,b) ((a)<(b)?(a):(b))
#define Max(a,b) ((a)>(b)?(a):(b))
#define pb(a) push_back(a)
#define mem(a,b) memset(a,b,sizeof(a))
#define LL long long
#define MOD 1000000007
using namespace std;
//以下为倍增算法求后缀数组  
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];  
int cmp(int *r,int a,int b,int l)  
{return r[a]==r[b]&&r[a+l]==r[b+l];}  
void da(const int *r,int *sa,int n,int m){  
    int i,j,p,*x=wa,*y=wb,*t;   
    for(i=0;i<m;i++) Ws[i]=0;   
    for(i=0;i<n;i++) Ws[x[i]=r[i]]++;   
    for(i=1;i<m;i++) Ws[i]+=Ws[i-1];   
    for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i;   
    for(j=1,p=1;p<n;j*=2,m=p){   
        for(p=0,i=n-j;i<n;i++) y[p++]=i;   
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;   
        for(i=0;i<n;i++) wv[i]=x[y[i]];   
        for(i=0;i<m;i++) Ws[i]=0;   
        for(i=0;i<n;i++) Ws[wv[i]]++;   
        for(i=1;i<m;i++) Ws[i]+=Ws[i-1];   
        for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i];   
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)   
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;   
    }   
    return;   
}  
int sa[maxn],Rank[maxn],height[maxn];  
//求height数组  
void calheight(const int *r,int *sa,int n){  
    int i,j,k=0;  
    for(i=1;i<=n;i++) Rank[sa[i]]=i;  
    for(i=0;i<n;height[Rank[i++]]=k)  
        for(k?k--:0,j=sa[Rank[i]-1];r[i+k]==r[j+k];k++);  
    return;  
} 
int a[maxn],pos[maxn];
char str[maxn];
int main(){
	int t,cas=0,n;
	scanf("%d",&t);
	while(t--){
		int len,m=0,num=30;//A串的长度,所有串叠加在一起的长度,分隔字符
		scanf("%d",&n);
		scanf("%s",str);
		len=strlen(str);
		for(int i=0;i<len;i++) a[m++]=str[i]-'a'+1;
		for(int i=0;i<n;i++){
			a[m++]=num++;
			scanf("%s",str);
			int l=strlen(str);
			for(int j=0;j<l;j++)
				a[m++]=str[j]-'a'+1;
		}
		a[m]=0;
		da(a,sa,m+1,num+1);
		calheight(a,sa,m);
		mem(pos,0);
		//从前往后推
		int tmp=inf;
		for(int i=1;i<=m;i++){
			if(sa[i]<len){
				if(height[i]<tmp) tmp=height[i];
				if(pos[sa[i]]<tmp) pos[sa[i]]=tmp;
			}
			else tmp=inf;
		}
		//从后往前推
		tmp=inf;
		for(int i=m;i>=1;i--){
			if(sa[i-1]<len){
				if(height[i]<tmp) tmp=height[i];
				if(pos[sa[i-1]]<tmp) pos[sa[i-1]]=tmp;
			}
			else tmp=inf;
		}
		//排除A串自身相同的子串
		for(int i=1;i<=m;i++)
             if(sa[i]<len&& sa[i-1]<len)
                if(pos[sa[i-1]]<height[i])  
                    pos[sa[i-1]]=height[i];  
		LL ans=(LL)len*(len+1)/2;
		for(int i=0;i<len;i++)
			ans-=pos[i];
		printf("Case %d: %I64d\n",++cas,ans);
	}
	return 0;
}



你可能感兴趣的:(算法,ini)