[省选前题目整理][UOJ 35]后缀排序(后缀数组)

题目链接

http://uoj.ac/problem/35

思路

后缀数组裸题。

代码

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <algorithm>

#define MAXN 1000000

using namespace std;

int sa[MAXN],rank[MAXN],height[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],cnt[MAXN];

bool cmp(int *r,int a,int b,int c)
{
    return (r[a]==r[b])&&(r[a+c]==r[b+c]);
}

void SA(int *r,int n,int m)
{
    int i,j,p;
    int *x=wa,*y=wb;
    for(i=0;i<m;i++) cnt[i]=0;
    for(i=0;i<n;i++) cnt[(x[i]=r[i])]++;
    for(i=1;i<m;i++) cnt[i]+=cnt[i-1];
    for(i=n-1;i>=0;i--) sa[--cnt[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++) y[p++]=i; //先加入没有第二关键字的二元组,它们是排在最前面的
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; //现在y[i]=第二关键字排名为i的二元组的第一关键字下标
        for(i=0;i<n;i++) wv[i]=x[y[i]]; //wv[i]=按照第二关键字排名的第一关键字
        for(i=0;i<m;i++) cnt[i]=0; //清零
        for(i=0;i<n;i++) cnt[wv[i]]++;
        for(i=1;i<m;i++) cnt[i]+=cnt[i-1]; //这一步操作后,cnt[i]=第一关键字下标为i的二元组伪排名
        for(i=n-1;i>=0;i--) sa[--cnt[wv[i]]]=y[i]; //!!!!sa[i]=排名为i的后缀的开头下标
        swap(x,y);
        for(p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; //这一步操作完后x[i]=第一关键字下标为i的二元组的排名
    }
}

void calc(int *r,int n) //长度为n的字符串r
{
    int i,j,k=0;
    for(i=1;i<=n;i++) rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}

char s[MAXN];
int num[MAXN];

int main()
{
    int n;
    scanf("%s",s);
    n=strlen(s);
    for(int i=0;i<n;i++) num[i]=s[i];
    SA(num,n+1,255);
    calc(num,n);
    for(int i=1;i<=n;i++) printf("%d ",sa[i]+1);
    puts("");
    for(int i=2;i<=n;i++) printf("%d ",height[i]);
    printf("\n");
    return 0;
}

你可能感兴趣的:([省选前题目整理][UOJ 35]后缀排序(后缀数组))