「学习笔记」回文树/回文自动机(Palindromic Tree)

引入

有时候题目要求一些这样的问题
1. 求以串 s s 本质不同的回文串个数(即长度不同或长度相同且至少有一个字符不相同的字符串)
2. 求以位置 i i 结尾的回文串个数。

这时候使用Manacher显然有点力不从心,我们可以使用一种比较新颖的字符串处理工具回文树(Palindromic Tree)。

回文树的结构

回文树其实是由两棵树组成的森林,第一棵树的根节点是 odd o d d ,第二棵树的根节点是 even e v e n 。每个森林中的节点其实是原串中的一个回文串。

每个节点保存以下信息:

  1. len l e n 表示当前节点代表的回文串的长度。特别的, lenodd=1 l e n o d d = − 1 , leneven=1 l e n e v e n = 1
  2. fail f a i l 表示当前节点失配以后可能匹配的最长回文串(即当前节点的最长回文后缀),特别的 failodd=odd f a i l o d d = o d d , faileven=even f a i l e v e n = e v e n
  3. ch c h 表示当前节点的孩子,其中 cha c h a 表示在当前字符串前后接上字符 a a 所形成的新回文串。

示例:下图是字符串 babbab b a b b a b 的回文树(实线表示 ch c h ,虚线表示 fail f a i l )

其实就是论文1里的图啦
不难看出 odd o d d 的子树保存的都是奇数长度的回文串,而 even e v e n 的子树中保存的都是偶数长度的回文串。

回文树的构造

回文树的构造采用增量构造。
假设我们已经构造串 s s 的回文树。现在要求出在 s s 后添加字符 c c 的回文树。

定理:以新加入的字符为结尾的,且未在 s s 中出现的回文字符串最多有 1 1 个,且必为新串的最长回文后缀。

所以只需要求出新串的最长回文后缀即可。不妨设原串 s s 的最长回文后缀为 si..|s| s i . . | s | ,那么只要 si1=c s i − 1 = c ,则新串的最长回文后缀一定为 si1..|s|+1 s i − 1.. | s | + 1 ,否则转移到 failsi..|s| f a i l s i . . | s | ,继续之前的操作。

如果新串的最长回文后缀没有在回文树中,则新建一个节点并找出它的 fail f a i l ,方法同上面类似。

回文树的复杂度

可以证明一个串 s s 本质不同的回文串不超过 |s| | s | 个,所以状态数为 O(|s|) O ( | s | )

而通过势能分析可以证明前文所述的方法时间复杂度为 O(|s|log) O ( | s | l o g ∑ ) (使用平衡树或c++中的map表示 ch c h )或 O(|s|) O ( | s | ) (使用数组表示 ch c h )。其中 为字符集大小。

回文树的一些扩展

  1. 从前端插入([HDU5241]Victor and String)
  2. 前后端插入,删除字符
  3. 可持久化回文树

老实说,除了第一个我都不会我还是太菜了。但论文里有详细讲解。

模板题

[APIO2014]Palindrome

Description

考虑一个只包含小写字母的字符串 s s ,定义一个回文串的出现值为 t t s s 中的出现次数与其长度的乘积。求 s s 的所有回文字串中的最大出现值。

Solution

首先建出 s s 的回文树,定义 vt=|s|i=1[ts1..i] v t = ∑ i = 1 | s | [ t 是 s 1.. i 的 最 长 回 文 后 缀 ] 。可以证明最终的出现次数就是所有儿子(包括自身) v v 值的和。那么只需要求出 v v 即可。方法是每次添加一个字符进回文串时给新串的 v v +1 + 1

#include 
using namespace std;

const int maxn = 300005;
int ch[maxn][26], f[maxn], v[maxn], l[maxn], n, la, tot;
char s[maxn];
long long ans;

inline void add(int c, int n)
{
    int x = la;
    while(s[n - l[x] - 1] != s[n]) x = f[x];
    if(!ch[x][c]) {
        int v = ++tot, k = f[x]; l[v] = l[x] + 2;
        while(s[n - l[k] - 1] != s[n]) k = f[k];
        f[v] = ch[k][c]; ch[x][c] = v;
    }
    v[la = ch[x][c]]++; return;
}

int main()
{
    freopen("palindrome.in", "r", stdin);
    freopen("palindrome.out", "w", stdout);

    scanf("%s", s + 1); n = strlen(s + 1);
    l[++tot] = -1; f[0] = f[1] = 1;
    for(int i = 1; i <= n; ++i) add(s[i] - 97, i);
    for(int i = tot; i; --i) ans = max(ans, 1ll * l[i] * v[i]), v[f[i]] += v[i];
    printf("%lld\n", ans);
    return 0;
}

  1. 参考资料:国家集训队2017论文集《回文树及其应用》——翁文涛。 ↩

你可能感兴趣的:(字符串——回文树/回文自动机,文章类型——学习笔记)