uoj#35. 后缀排序 后缀数组

uoj#35. 后缀排序
裸的后缀数组……
敲了2遍……
希望……不要忘记QAQ
参考了lrj代码和某个AC神犇参考了lrj代码后写的代码……

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
using namespace std;
const int N=200005;
int n;
int sa[N],c[N],t1[N],t2[N];
int rank[N],height[N];
char s[N];
void buildsa(int m){
    int i,*x=t1,*y=t2;
    for(i=1;i<=m;i++) c[i]=0;
    for(i=1;i<=n;i++) c[x[i]=s[i]]++;
    for(i=1;i<=m;i++) c[i]+=c[i-1];
    for(i=n;i>=1;i--) sa[c[x[i]]--]=i;
    for(int k=1;k<=n;k<<=1){
        int p=0;
        for(i=n-k+1;i<=n;i++) y[++p]=i;
        for(i=1;i<=n;i++) if(sa[i]>k) y[++p]=sa[i]-k;
        for(i=1;i<=m;i++) c[i]=0;
        for(i=1;i<=n;i++) c[x[y[i]]]++;
        for(i=1;i<=m;i++) c[i]+=c[i-1];
        for(i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i];
        swap(x,y);
        x[sa[1]]=1;p=1;
        for(i=2;i<=n;i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p:++p;
        if(p>=n) break;
        m=p;
    }
}
void getheight() {
    int i,j,k=0;
    for (i=1;i<=n;i++) rank[sa[i]]=i;
    for (i=1;i<=n;i++) {
        if (k) k--;
        j=sa[rank[i]-1];
        while (s[i+k]==s[j+k]) k++;
        height[rank[i]]=k;
    }
}
int main(){
    freopen("in.txt","r",stdin);
    freopen("out.txt","w",stdout);
    scanf("%s",s+1);n=strlen(s+1);
    buildsa(128);
    for(int i=1;i<=n;i++) printf("%d ",sa[i]);puts("");
    getheight();
    for(int i=2;i<=n;i++) printf("%d ",height[i]);puts("");
    return 0;
}

那个神犇加了注释

#include<iostream>
#include<cstring>
#include<cstdio>
#include<cstdlib>
#include<algorithm>
using namespace std;
const int maxn=200011;
char s[maxn];
int c[maxn],t1[maxn],t2[maxn],sa[maxn],rank[maxn],height[maxn],f[maxn][20];
int i,j,k,m,n;

//后缀数组倍增算法,假设输入的字符串为s[1..n]
//sa[i]表示字典序第i小的后缀在串s中的位置
//rank[i]表示从位置i开始的后缀在串s的所有后缀中排第几
//height[i]表示字典序第i-1小的后缀与字典序第i小的后缀的最长公共前缀

void buildsa(int m,int *sa,char *s) {
    int i,*x=t1,*y=t2;
    for (i=1;i<=m;i++) c[i]=0;
    for (i=1;i<=n;i++) c[x[i]=s[i]]++;//次数,为方便直接用字母序当第一关键字x[i]
    for (i=1;i<=m;i++) c[i]+=c[i-1];//转为排名
    for (i=n;i>=1;i--) sa[c[x[i]]--]=i;//构建2^0的后缀数组
    for (k=1;k<=n;k<<=1) {
        //每次使用基数排序算法构建长度为2^k的后缀数组
        int p=0;
        //第二关键字排序
        for (i=n-k+1;i<=n;i++) y[++p]=i;//第二关键字为空肯定最小
        for (i=1;i<=n;i++) if (sa[i]>k) y[++p]=sa[i]-k;//sa[i]前有sa[i]个元素,不足k个时无法作为第二关键字,不管;
        //否则向前推k个单位。

        //第一关键字排序
        for (i=1;i<=m;i++) c[i]=0;//初始化
        for (i=1;i<=n;i++) c[x[y[i]]]++;//第一关键字次数
        for (i=1;i<=m;i++) c[i]+=c[i-1];//转为排名|第一关键字划定大区间
        for (i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i];//把第二关键字排序后的数塞入sa中第一关键字划定的大区间 
        swap(x,y);//y存下上一轮的rank
        p=1;x[sa[1]]=1;
        for (i=2;i<=n;i++) x[sa[i]]=y[sa[i-1]]==y[sa[i]] && y[sa[i-1]+k]==y[sa[i]+k]?p:++p;
        if (p>=n) break;
        m=p;
    }
}

void getheight(char *s,int *sa,int *rank,int *height) {
    int i,j,k=0;
    for (i=1;i<=n;i++) rank[sa[i]]=i;//利用求得的sa数组计算rank数组
    for (i=1;i<=n;i++) {
        if (k) k--;
        j=sa[rank[i]-1];//利用height[rank[i]]>=height[rank[i-1]]-1计算height数组
        while (s[i+k]==s[j+k]) k++;
        height[rank[i]]=k;
    }
}

void initrmq(int f[maxn][20],int *height) {
    int i,j;
    for (i=1;i<=n;i++) f[i][0]=height[i];
    for (j=1;1<<j<=n;j++)
        for (i=1;i<=n-(1<<j)+1;i++)
            f[i][j]=min(f[i][j-1],f[i+(1<<j>>1)][j-1]);
}

int getrmq(int f[maxn][20],int i,int j) {
    if (!i || !j) return 0;
    if (i>j) swap(i,j);
    int s=i+1,t=j,k;
    for (k=0;(1<<k)<=t-s+1;k++);
    k--;
    return min(f[s][k],f[t-(1<<k)+1][k]);
}

int main() {
    freopen("in.txt","r",stdin);
    freopen("right.txt","w",stdout);
    scanf("%s",s+1);n=strlen(s+1);
    buildsa(128,sa,s);
    getheight(s,sa,rank,height);
    for (i=1;i<=n;i++) printf("%d ",sa[i]);
    puts("");
    for (i=2;i<=n;i++) printf("%d ",height[i]);
    puts("");
    return 0;
}

你可能感兴趣的:(后缀数组,uoj)