转载请注明出处,谢谢http://blog.csdn.net/acm_cxlove/article/details/7854526 by---cxlove
题目:给出一个A串,给出若干个B串,问A串中有多少个不同的子串不是B中的子串
http://acm.hdu.edu.cn/showproblem.php?pid=4416
比赛中挺可惜的一题。
当时看了一下数据范围,A串为10W,看了一下Clarification,有10W的B串,但是题目说的是B串的长度总和不超过10W,我以为是每一个B串不超过10W。当时就吓尿了,果断放弃了
其实这种子串问题,比较明显是后缀数组,但是当时的数据让我没办法把所有的串拼接在一起。哎~~~~
将所有的串拼接在一起,中间用一个不同的字符分隔开。然后求一次后缀数组以及height数组。
然后对于A中的某一个后缀,统计一下有B中的LCA有多少,就OK了,说明有A的这个后缀有LCA个子串在B中出现过。
只需要从前往后以及从后往前统计一次height就OK了。注意我们这里统计的是A与B的LCA。如果连续的两个sa是A中,那我们需要求一次最小值,保证求的是和B串的LCA。
但是题目要求的是A中的不同的子串,所以还要去重,遍历一次,如果连续两个都是A串的,则更新一下
#include<iostream> #include<cstdio> #include<map> #include<cstring> #include<cmath> #include<vector> #include<algorithm> #include<set> #include<string> #include<queue> #define inf 1<<28 #define M 6000005 #define N 1000005 #define maxn 300005 #define Min(a,b) ((a)<(b)?(a):(b)) #define Max(a,b) ((a)>(b)?(a):(b)) #define pb(a) push_back(a) #define mem(a,b) memset(a,b,sizeof(a)) #define LL long long #define MOD 1000000007 using namespace std; //以下为倍增算法求后缀数组 int wa[maxn],wb[maxn],wv[maxn],Ws[maxn]; int cmp(int *r,int a,int b,int l) {return r[a]==r[b]&&r[a+l]==r[b+l];} void da(const int *r,int *sa,int n,int m){ int i,j,p,*x=wa,*y=wb,*t; for(i=0;i<m;i++) Ws[i]=0; for(i=0;i<n;i++) Ws[x[i]=r[i]]++; for(i=1;i<m;i++) Ws[i]+=Ws[i-1]; for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i; for(j=1,p=1;p<n;j*=2,m=p){ for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<n;i++) wv[i]=x[y[i]]; for(i=0;i<m;i++) Ws[i]=0; for(i=0;i<n;i++) Ws[wv[i]]++; for(i=1;i<m;i++) Ws[i]+=Ws[i-1]; for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i]; for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } return; } int sa[maxn],Rank[maxn],height[maxn]; //求height数组 void calheight(const int *r,int *sa,int n){ int i,j,k=0; for(i=1;i<=n;i++) Rank[sa[i]]=i; for(i=0;i<n;height[Rank[i++]]=k) for(k?k--:0,j=sa[Rank[i]-1];r[i+k]==r[j+k];k++); return; } int a[maxn],pos[maxn]; char str[maxn]; int main(){ int t,cas=0,n; scanf("%d",&t); while(t--){ int len,m=0,num=30;//A串的长度,所有串叠加在一起的长度,分隔字符 scanf("%d",&n); scanf("%s",str); len=strlen(str); for(int i=0;i<len;i++) a[m++]=str[i]-'a'+1; for(int i=0;i<n;i++){ a[m++]=num++; scanf("%s",str); int l=strlen(str); for(int j=0;j<l;j++) a[m++]=str[j]-'a'+1; } a[m]=0; da(a,sa,m+1,num+1); calheight(a,sa,m); mem(pos,0); //从前往后推 int tmp=inf; for(int i=1;i<=m;i++){ if(sa[i]<len){ if(height[i]<tmp) tmp=height[i]; if(pos[sa[i]]<tmp) pos[sa[i]]=tmp; } else tmp=inf; } //从后往前推 tmp=inf; for(int i=m;i>=1;i--){ if(sa[i-1]<len){ if(height[i]<tmp) tmp=height[i]; if(pos[sa[i-1]]<tmp) pos[sa[i-1]]=tmp; } else tmp=inf; } //排除A串自身相同的子串 for(int i=1;i<=m;i++) if(sa[i]<len&& sa[i-1]<len) if(pos[sa[i-1]]<height[i]) pos[sa[i-1]]=height[i]; LL ans=(LL)len*(len+1)/2; for(int i=0;i<len;i++) ans-=pos[i]; printf("Case %d: %I64d\n",++cas,ans); } return 0; }