给定两个长度为N字符串A与B,求出最大的L,使得A与B的前L个字符所组成的字符串循环同构。N<=2000000。
我们知道循环同构的一个特征:可以找到分界点分成两个字符串,然后交叉相同。例如aab与aba,我们可以把第一个字符串分割成a与ab,把第二个字符串分割成ab与a,那么他们交叉相同。
因此我们可以枚举A中分界点i,那么假设能找到B中分界点j,需要满足以下条件:
1、A的后缀i+1与B的LCP(最长公共前缀)长度>=j
2、B的后缀j+1与A的LCP长度>=i
根据上面的条件很容易联想到扩展KMP,因此我们求出exA[i]表示A的后缀i与B的LCP,exB[i]含义类似。
枚举分界点i,然后我们需要在B的1~exA[i+1]之中找到最大的j使其满足exB[j+1]>=i。
看上去需要打线段树,可是这样就超时了,怎么办呢?
注意到枚举的分界点i是递增的,因此我们可以使用并查集优化。
让i连向i-1,每次从exA[i+1]这个结点开始搜,如果一个点不符合exB值>=i,那么get它的father然后路径压缩。代码
int getfa(int a,int b){
if (!a) return 0;
if (exB[a+1]>=b) return a;else return fa[a]=getfa(fa[a],b);
}
#include<cstdio>
#include<algorithm>
#define fo(i,a,b) for(i=a;i<=b;i++)
#define fd(i,a,b) for(i=a;i>=b;i--)
using namespace std;
const int maxn=2000000+10;
char a[maxn],b[maxn];
int nextA[maxn],nextB[maxn],exA[maxn],exB[maxn],fa[maxn];
int i,j,k,l,t,n,m,p,ans;
int getfa(int a,int b){
if (!a) return 0;
if (exB[a+1]>=b) return a;else return fa[a]=getfa(fa[a],b);
}
int main(){
scanf("%d",&n);
getchar();getchar();
fo(i,1,n) scanf("%c",&a[i]);
a[n+1]='&';
getchar();getchar();
fo(i,1,n) scanf("%c",&b[i]);
b[n+1]='%';
while (a[1+nextA[2]]==a[2+nextA[2]]) nextA[2]++;
k=2;
fo(i,3,n){
nextA[i]=max(0,min(nextA[k]+k-i,nextA[i-k+1]));
while (a[i+nextA[i]]==a[nextA[i]+1]) nextA[i]++;
if (nextA[k]+k<=nextA[i]+i) k=i;
}
while (b[1+nextB[2]]==b[2+nextB[2]]) nextB[2]++;
k=2;
fo(i,3,n){
nextB[i]=max(0,min(nextB[k]+k-i,nextB[i-k+1]));
while (b[i+nextB[i]]==b[nextB[i]+1]) nextB[i]++;
if (nextB[k]+k<=nextB[i]+i) k=i;
}
k=1;
fo(i,2,n){
exA[i]=max(0,min(exA[k]+k-i,nextB[i-k+1]));
while (a[i+exA[i]]==b[exA[i]+1]) exA[i]++;
if (exA[k]+k<=exA[i]+i) k=i;
}
k=1;
fo(i,1,n){
exB[i]=max(0,min(exB[k]+k-i,nextA[i-k+1]));
while (b[i+exB[i]]==a[exB[i]+1]) exB[i]++;
if (exB[k]+k<=exB[i]+i) k=i;
}
fo(i,1,n) fa[i]=i-1;
fo(i,2,n-1){
j=getfa(exA[i+1],i);
if (j) ans=max(ans,i+j);
}
printf("%d\n",ans);
}