后缀数组代码详解

//
//  main.cpp
//  后缀数组模板详解
//
//  Created by XD on 15/9/24.
//  Copyright © 2015年 XD. All rights reserved.
//

#include 
using namespace std ;
const int maxn = 10000 ;
int s[maxn] ;
int sa[maxn],t1[maxn] , t2[maxn] ,c[maxn] ;
void getSa(int n,int m )
{
    int i , j ;
    int *x = t1 , *y = t2 ,*temp;
    for(int i = 0 ; i <=m ; i++) c[i] =0 ;
    for(int i = 0 ; i < n ; i++) c[x[i] = s[i]]++ ;
    for(i = 1 ; i <=m ; i++) c[i] += c[i-1] ;
    for(int i = n-1 ; i >-1 ; i -- ) sa[--c[x[i]]] = i ;
    //下面是最关键的一段代码
    for(int k = 1 ; k <= n ; k*= 2 )
    {
        int p  =0  ;
        //先计数排序第二关键字,这里不需要重复计数排序的步骤,因为在上一次的排序过后,是第一关键字的顺序,可是根据倍增算法的特点,这一次的第二关键字的顺序与上一次的排序的第一关键字(注意有的位置后面是没有第二关键字的)
       
        
        //这是因为从 n -  k到n-1的位置上第二关键字都是没有的。这是设为最小的,因为当一个字符串是另一个字符串的前缀时,后面的子符串是较大的。这里还有一个问题,有人说可能第一关键字都是不完整的,那为什么可以比较大小呢。因为我们在原字符串的末尾加了一个$,我们认为这个$符号是最小的,又用因为后缀的长度是不同的,所以在仅有的长度下就可以比较出大小,因此即使有的关键字没达到k的长度,但是任然是可行的。
        for(i = n - k ;  i < n ; i ++ ) y[p++] = i ;
        //这里是对具有第二关键字的那部分排序,当然不能忽略不具有第一关键字的那部分,因此才有sa[i]>=k.
        for(i = 0 ; i < n ; i ++) if(sa[i]>=k) y[p++] = sa[i] - k ;
        
        //对第一关键字排序
        for(i = 0 ; i <=m; i++) c[i] = 0 ;
        //这里是x[y[i]]的原因是对第二关键字排序后,需按照其结果的对第一关键字排序,而y[i]存的是第一关键字的位置
        for(i = 0 ; i < n ;i++) c[x[y[i]]]++ ;
        for(i = 1 ;i<=m;i++) c[i] += c[i-1] ;
        for(i = n - 1; i > -1;i--) sa[--c[x[y[i]]]] = y[i] ;
        //下面要更新x数组
        temp = x ; x = y ; y = temp ;
        x[sa[0]] = 1 ; p=1;
        for(i = 1 ; i < n ;i++)
        {
            //根据排序确定下一次的x数组的值
            x[sa[i]] = (y[sa[i]] == y[sa[i-1]] && y[sa[i] + k]==y[sa[i-1] + k ])? p : ++p  ;
        }
        if(p >= n){
            break ;
        }
        m = p ;
    }
}
int main(int argc, const char * argv[]) {
    int n ;
    while (scanf("%d" , &n),n) {
        for (int i= 0 ; i < n ; i++) {
            scanf("%d" , &s[i]) ;
            s[i]++ ;
        }
    s[n] =1 ;
    getSa(n+1 , 100) ;
    for (int i = 0; i <= n; i++) {
        printf("%d ",sa[i]) ;
    }
    }
    return 0;
}


你可能感兴趣的:(后缀数组代码详解)