【CF1200E】Compress Words【kmp】

传送门

题意:给 N N N个由大小写字母、数字组成的字符串,两个字符串 S , T S,T S,T合并时,删除 T T T最长的是 S S S的后缀的前缀,然后接在一起。现将这些字符串依次合并,求最终字符串。

N ≤ 1 e 5 , ∑ ∣ S i ∣ ≤ 1 e 6 N \leq 1e5,\sum|S_i|\leq 1e6 N1e5,Si1e6

首先字符集有 60 60 60多,显然在卡自动机。

字符集无关的算法有 k m p , m a n a c h e r , S A , kmp,manacher,SA, kmp,manacher,SA,哈希

m a n a c h e r manacher manacher不现实, S A SA SA不好做

考虑 k m p kmp kmp

维护当前串 S S S,每次读入一个串 T T T,求出 T T T n e x t next next数组,用 S S S去匹配,最后的 j j j就是最长公共前后缀,把后面的加入 S S S

赛场上这样就得到了 O ( ∑ ∣ S i ∣ 2 ) O(\sum |S_i|^2) O(Si2)的优秀做法


冷静分析,我们发现 S S S前面的位置即使配出来了也对答案没有贡献

即:只有最后 ∣ T ∣ |T| T的位置是有用的

所以匹配时可以只跑最后 ∣ T ∣ |T| T

复杂度 O ( ∑ ∣ S i ∣ ) O(\sum |S_i|) O(Si)

#include 
#include 
#include 
#include 
#define MAXN 1000005
using namespace std;
char s[MAXN],t[MAXN];
int nxt[MAXN];
int main()
{
	int n;
	scanf("%d",&n);
	scanf("%s",s+1);
	int now=strlen(s+1);
	for (int c=2;c<=n;c++)
	{
		scanf("%s",t+1);
		int m=strlen(t+1);
		nxt[0]=nxt[1]=0;
		int j=0;
		for (int i=2;i<=m;i++)
		{
			while (j&&t[i]!=t[j+1]) j=nxt[j];
			if (t[i]==t[j+1]) ++j;
			nxt[i]=j;
		}
		j=0;
		for (int i=max(now-m+1,1);i<=now;i++)
		{
			while (j&&s[i]!=t[j+1]) j=nxt[j];
			if (s[i]==t[j+1]) ++j;
		}
		for (++j;j<=m;++j) s[++now]=t[j];
	}
	puts(s+1);
	return 0;
}

你可能感兴趣的:(【CF1200E】Compress Words【kmp】)