马拉车 Manacher

Manacher,也叫马拉车。是用来查找一个字符串的最长回文子串的线性算法。

一个字符串的长度有可能是偶数也可能是奇数。为了实现方便,对原串略加改动。如 ababca$#a#b#a#b#c#a#,令新串为 s s s

定义 p i p_i pi 为以 i i i 为对称中心的最长回文半径。刚刚栗子的 p p p

$ # a # b # a # b # c # a # 
1 1 2 1 4 1 4 1 2 1 2 1 2 1

可以发现:非字母字符对应的 p i p_i pi 为奇数,字母字符对应的 p i p_i pi 为偶数。在新串中,因为有其它的字符,所以以 i i i 为中心的最长回文子串长度为 p i − 1 p_{i} - 1 pi1。那么初始化是简单明了的。

void init(){
	str[1] = '$'; str[2] = '#';
	for (int i = 1; i <= n; i++) str[i * 2 + 1] = s[i], str[i * 2 + 2] = '#';
	n = (n + 1) * 2 + 1; 
}

难点在构造 p p p,从左到右构造 p p p 数组。令 m x mx mx 为以 i d id id 为中心的最长回文子串的右边界,有 i d + p i d = m x id + p_{id} = mx id+pid=mx。对于当前的 i i i,如果有 i < m x i < mx i<mx,那么 p i = min ⁡ { p 2 × i d − i , m x − i } p_i = \min \{ p_{2 \times id - i}, mx - i\} pi=min{p2×idi,mxi}

略证:令 j j j 2 × i d − i 2 \times id - i 2×idi,那么 p i = min ⁡ { p j , m x − i } p_i = \min \{ p_j, mx-i \} pi=min{pj,mxi}。有 i + j 2 = i d \frac{i + j}{2} = id 2i+j=id,故根据中点公式知 i d id id i i i j j j 的中点。

如下图,对于取 p j p_j pj 的情况为 i i i j j j 那一段相等。那么 i i i 的那一段能更长吗?不能的,因为如果更长,意味着 s l − 1 = s r + 1 s_{l-1} = s_{r+1} sl1=sr+1 了。如果成立,有 l − 1 l-1 l1 与 匹配 l − 1 l-1 l1 的点相同,进而有蓝线的成立关系,蓝线成立则与 p j p_j pj 已经求出矛盾。

马拉车 Manacher_第1张图片

刚才讨论的情况是 p j p_j pj i d id id 的覆盖范围的,若超出,那么不满足限定 i i i j j j 那一段相等。如下图,根据 i d id id i i i j j j 的中点,可知 p i p_i pi 最短也是 m x − i mx-i mxi,那么可能更大即为 i i i 扩展到 m x mx mx 往右呢?不能的,因为若想让蓝线成立,那么有绿线成立,进而有橙线成立,而橙线成立超出了以 i d id id 为对称中心 的 m x mx mx 的边界而矛盾。

马拉车 Manacher_第2张图片

综上所述。 p i = min ⁡ { p 2 × i d − i , m x − i } p_i = \min \{ p_{2 \times id - i}, mx - i\} pi=min{p2×idi,mxi},并随时更新 i d id id m x mx mx

void manacher(){
	int mx = 0, id = 0;
	for (int i = 2; i <= n; i++){
		if (i < mx) p[i] = min(p[id * 2 - i], mx - i);
		else p[i] = 1;
		for (; str[i + p[i]] == str[i - p[i]]; p[i]++) 
			if (p[i] + i > mx) id = i, mx = p[i] + i;
	}
}

马拉车还可用于 hash,所以不一定是字母回文,还可能是数字回文。

#include 
using namespace std;
#define re register
#define F first
#define S second
typedef long long ll;
typedef pair<int, int> P;
const int N = 3e7 + 1e6 + 5;
const int INF = 0x3f3f3f3f;
int read() {
	int x = 0, f = 0; char ch = 0;
	while (!isdigit(ch)) f |= ch == '-', ch = getchar();
	while (isdigit(ch)) x = (x << 3) + (x << 1) + (ch ^ 48), ch = getchar();
	return f ? -x : x;
}
int n, p[N];
char s[N], str[(N << 1) + 100];
void init(){
	str[0] = '$'; str[1] = '#';
	for (int i = 0; i < n; i++) str[(i << 1) + 2] = s[i], str[(i << 1) + 3] = '#';
	n = (n << 1) + 2;
}
void manacher(){
	int mx = 0, id = 0;
	for (int i = 1; i < n; i++){
		if (i < mx) p[i] = min(p[(id << 1) - i], mx - i);
		else p[i] = 1;
		for (; str[i + p[i]] == str[i - p[i]]; p[i]++) 
			if (p[i] + i > mx) id = i, mx = p[i] + i;
	}
}
int main(){
	scanf("%s", s); n = strlen(s);
	init(); manacher();
	int ans = 0;
	for (int i = 0; i < n; i++) ans = max(ans, p[i]);
	printf("%d\n", ans - 1);
	return 0;
}

你可能感兴趣的:(马拉车,manacher)