后缀自动机SAM

做了一些关于后缀自动机的题,写一下自己的一点理解吧
在开始看后缀自动机之前建议看一下后缀树,这样在做题的时候比较好想一点,感觉后缀树比自动机直观一点
后缀树的链接http://blog.163.com/ps_lm/blog/static/20790406120125883433110/
后缀自动机http://fanhq666.blog.163.com/blog/static/8194342620123352232937/

后缀自动机其实就是一颗后缀树,str的后缀自动机并不是str的后缀树
我们用倒序的str的前缀的逆序来构造后缀树才是后缀自动机
比如abaab
我们往后缀树上依次添加串a,ba,aba,aaba,baaba这样构造出来的
后缀自动机上的后缀就相当于构造出来的后缀树的逆序
下面有abaaaba的图来做例子(我自己做的图太丑了… 好看的是从别人那里弄得http://roosephu.blog.163.com/blog/static/2037060302012399282476/
后缀树(这棵树的父亲指针就是SAM的父亲指针
后缀自动机SAM_第1张图片
下边这个是后缀树的trans指针
后缀树的trans指针就是SAM的son指针
后缀自动机SAM_第2张图片
然后是SAM的son指针
后缀自动机SAM_第3张图片
SAM的fa指针
后缀自动机SAM_第4张图片
从上边就可以把后缀树和后缀自动机联系起来
后缀树的fa=SAM的fa
后缀树的trans=SAM的son

后缀自动机里的fa指针作用就是比如说我们现在有三个状态节点
1.abaab
2.baab
3.ab
这里我们的fa指针就是1->fa=2,2->fa=3
fa指针只跳到与当前状态后缀匹配长度最长的节点,可以通过一直跳fa来找到想找到匹配后缀
我们经常在题目中遇到一个简单的问题,就是问B串在A串中出现了几次
很明显,我们如果B串包括abaab就是1,那baab和ab也被包括了,我们只需要mark上1就行了,最后通过topsort后的顺序来跳fa指针来统计2,3状态出现的次数

len
因为一个SAM的节点会接受很多节点,所以我们无法确定走到当前结点的长度是多少,但是len是所有接受状态中最长的那个的长度

SAM中添加x节点有两中方式
1.sam[p].len+1==sam[sam[p].son[x]].len
这个就等于在后缀树上比如说aab
添加a后,我们要添加一个aa,我们只需要把新添节点放到添加a节点的儿子里就行了,这里的儿子并不是SAM的儿子,然后trans[(a的接受节点)][a]=当前结点就行了
2.sam[p].len+1 < sam[sam[p].son[x]].len

就相当于在后缀树上的baa串
先添加b,ab后,我们要添加aab,我们已经有ab状态了,我们就把ab状态拆开,拆成a节点和a节点的儿子b节点,然后再有一个ab是a的儿子

听说后缀自动机能解决后缀树和后缀数组的一切问题,真是太神了ORZ,就不用纠结于DC3和倍增什么的了,但是如果是又数字组成的字符串而且数字很大的话就要用后缀数组了

你可能感兴趣的:(后缀自动机SAM)