[置顶] 【后缀数组学习中】

小白书 219 页入门


大概懂得后缀数组原理 即后缀排序后的下标所形成的数组


裸的算法是 n*n*logn:直接利用定义 对所有后缀快排........


稍微好点. nlogn的倍增算法 原理懂了


更好点 线性时间的...只是简单涉及了没有


逛逛博客 学习前人优秀代码风格


http://dongxicheng.org/structure/suffix-array/

很好的将几篇国家队论文整合了,题目,介绍都有。好好研究


http://blog.csdn.net/xymscau/article/details/8798046

提供了代码和几个练习题

http://www.cnblogs.com/kuangbin/archive/2013/05/20/3089189.html

kuangbing写的

const int MAXN=300000;
char s[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
void build_sa(int m){
    int *x=t, *y=t2;
    for(int i = 0 ; i < m ;i++) c[i] = 0;
    for(int i = 0 ; i < n ;i++) c[x[i]=s[i]]++;
    for(int i = 1 ; i < m ;i++) c[i] += c[i-1];
    for(int i=n-1 ; i >= 0;i--) sa[--c[x[i]]] = i;
    for(int k = 1 ; k <= n; k <<=1) {
        int p=0;
        //直接利用sa数组排序第二关键字
        for(int i = n-k ;i < n ;i++) y[p++]=i;
        for(int i = 0; i < n; i++)   if(sa[i] >= k) y[p++] = sa[i]-k;
        //基数排序第一关键字
        for(int i = 0; i < m; i++)   c[i]=0;
        for(int i = 0; i < n; i++)   c[x[y[i]]]++;
        for(int i = 0; i < m; i++)   c[i] += c[i-1];
        for(int i = n-1;i >= 0; i--) sa[--c[x[y[i]]]]=y[i];
        //根据sa和y数组重新计算新的y数组
        swap(x,y);
        p = 1; x[sa[0]] = 0;
        for(int i = 1;i < n; i++)
            x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1: p++;
        if(p >=n ) break;
        m=p;
    }
}

以上代码还需好好研究.

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

罗穗骞

后缀数组——处理字符串的有力工具

仔细研读后缀数组基本能全懂了


一.后缀数组代码

1.为什么要在最后加一个很小的在最后呢?(在第九页解释了)

这里可以看到规定s[n]=0 的好处,如果s[a]=s[b] 说明以s[a]或s[b]开头的长度为l的字符串肯定不包括字符s[n]

所以调用s[a+l] 和s[b+l] 不会导致数组下标越界,这样就不需要做特殊判断。


二.后缀数组的应用

2.1 最长公共前缀

height 数组:定义 height[i]= suffix(sa[i-1]) 和 suffix(sa[i]) 的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。

你可能感兴趣的:([置顶] 【后缀数组学习中】)