小Biu的期中考试刚刚结束,调皮的小Biu不喜欢学习,所以他考试中抄袭了小Piu的试卷。
考试过程中一共有n道题目,每道题目的标准答案为区间[1,5]中的一个正整数。
现在有小Piu和小Biu的答案序列a和b,现在老师想知道两个答案序列最长连续相等的子串的长度是多少。
比如一共有10道题,a序列为(1 1 2 1 2 1 2 1 1 5),b序列为(3 3 2 3 1 2 1 1 3 4),则最长相等的子串为(1,2,1,1),所以答案为4。
收起
第1行:一个正整数n,表示题目的个数。(1<=n<=100000)
第2行:n个正整数,第i个正整数表示a[i]。(1<=a[i]<=5)
第3行:n个正整数,第i个正整数表示b[i]。(1<=b[i]<=5)
输出一个正整数表示两个序列的最长相等子串的长度。
10
1 1 2 1 2 1 2 1 1 5
3 3 2 3 1 2 1 1 3 4
4
罗穗骞《后缀数组——处理字符串的有力工具》例题.
首先如果这两个长字符串存在某个最长的公共子串,那么该子串一定分别是这两个串的后缀的前缀.所以我们将两个串中间加一个符号’$’然后连接起来形成一个新串(还要添尾0).然后我们求这个新串的height数组值,我们从sa[1]到新串长sa[n-1]依次扫描字典序相邻的两个后缀的LCP,如果这两个后缀分别属于之前不同的两个串,那么他们的LCP值就可能是他们最长连续公共子串的长度。否则的话就不是。
为什么上面的做法对呢?想想假设串a和串b存在最长字串c(长len),那么c是a串的后缀i的前缀,c是b串的后缀j的前缀。所以在新串中按字典序排序的height数组,后缀i和后缀j一定是相邻的。假设后缀i与后缀j之间还有后缀k,无论后缀k属于a串还是b串,k肯定与i与j的公共部分要>=len(想想是不是这样?)
另外如果我们连接两个原始串,中间不加’$’符号的话,会出现什么情况呢?比如串aaa和串aaaaaaa,那么就会算的他们的后缀LCP可能为6了,这明显是错的.所以要分隔符’$’.
#include
using namespace std;
const int maxn=300000+1000;
int len1,len2;
int num[maxn];
struct SuffixArray
{
char s[maxn];
///_rank[i] 第i个后缀的排名; SA[i] 排名为i的后缀位置; Height[i] 排名为i的后缀与排名为(i-1)的后缀的LCP
int sa[maxn],_rank[maxn],height[maxn];
///c[i] 基数排序辅助数组
int t1[maxn],t2[maxn],c[maxn],n;
int dmin[maxn][21];
void init()
{
memset(height,0,sizeof(height));
memset(_rank,0,sizeof(_rank));
memset(sa,0,sizeof(sa));
memset(c,0,sizeof(c));
memset(t1,0,sizeof(t1));
memset(t2,0,sizeof(t2));
memset(dmin,0,sizeof(dmin));
}
void build_sa(int m) ///m大于s[]数组出现的任意字符的int值
{
/// x[i]是第i个元素的第一关键字 y[i]表示第二关键字排名为i的数,第一关键字的位置
int i,p,*x=t1,*y=t2;
x[n]=y[n]=-1;
for(i=0; i=0; i--)
sa[--c[x[i]]]=i;
for(int k=1; k<=n; k<<=1)
{
p=0;
for(i=n-k; i=k)
y[p++]=sa[i]-k;
for(i=0; i=0; i--)
sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1;
x[sa[0]]=0;
for(i=1; i=n)
break;
m=p;
}
}
void build_height()//单个字符也行
{
int i,j,k=0,r;
for(i=0; ia2)
swap(a1,a2);
if(a1>=0&&a1<=len1-1&&a2>=len1+1&&a2<=len1+len2)
ans = max(ans,height[i]);
}
return ans;
}
void initMin()
{
for(int i=0; iR)
swap(L,R);
L++;//注意这里
return RMQ(L,R);
}
int num()//子串的个数
{
int ans=0;
for(int i=1; i>1;
if(RMQ(mid+1,pos)>=len)
r=mid;
else
l=mid+1;
}
L=l;
l=pos;
r=n-1;
while(l>1;
if(RMQ(pos+1,mid)>=len)
l=mid;
else
r=mid-1;
}
R=l;
}
//恰好出现w次子串的个数
int num_w(int w)
{
int ans=0;
for(int i=0; i+w-1