2020牛客暑期多校训练营(第一场)A B-Suffix Array —— 后缀数组+归并排序

This way

题意:

现在有一个长度为n的仅包含a,b两种字符的字符串,定义数组b
在这里插入图片描述
然后对于当前串s的所有后缀都求一遍b之后,按b数组字典序从小到大输出后缀的起点。

题解:

赛场上完全想不出来,是别人教的,首先考虑归并排序,对于当前两个位置,我们先找到它后面第一个另一种字符的位置:
2020牛客暑期多校训练营(第一场)A B-Suffix Array —— 后缀数组+归并排序_第1张图片
哪个的前面相同部分长度更小,哪个字典序就小。如果相同的话,那么就求出第一个不同位置之后的最长公共前缀(lcp),然后那个位置之后的后缀的rank大小就是两个字典序的大小。
我这个模板的初始化的时候rk[n]的位置需要变成0,因为有可能在第一个不同字符种类的位置就是最后一个位置,在后面就越界了。

#include
#pragma comment(linker, "/STACK:102400000,102400000")//防止爆栈
using namespace std;
const int N =(int)2e5+10;
int wa[N],wb[N],wv[N],we[N],rk[N];
int cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];}
void build_sa(int *r,int *sa,int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++)we[i]=0;
    for(i=0;i<n;i++)we[x[i]=r[i]]++;
    for(i=1;i<m;i++)we[i]+=we[i-1];
    for(i=n-1;i>=0;i--)sa[--we[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p){
        for(p=0,i=n-j;i<n;i++)y[p++]=i;
        for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
        for(i=0;i<n;i++)wv[i]=x[y[i]];
        for(i=0;i<m;i++)we[i]=0;
        for(i=0;i<n;i++)we[wv[i]]++;
        for(i=1;i<m;i++)we[i]+=we[i-1];
        for(i=n-1;i>=0;i--)sa[--we[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
        x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}
int height[N];
void calheight(int *r,int *sa,int n){
    int i,j,k=0;
    for(i=1;i<=n;i++)rk[sa[i]]=i;
    for(i=0;i<n;height[rk[i++]]=k){
        for(k?k--:0,j=sa[rk[i]-1];r[i+k]==r[j+k];k++);
    }
}
int sa[N],a[N];
//sa是从1~n,开始的值是0,rk是从0~n-1,开始的值是1
int n,k,ans[N],tmp[N],nex[N][2];
char s[N];
void merge(int l,int r){
    if(l==r)return ;
    int mid=l+r>>1;
    merge(l,mid),merge(mid+1,r);
    int p1=l,p2=mid+1;
    int cnt=l;
    while(p1<=mid&&p2<=r){
        int n1=nex[ans[p1]][(s[ans[p1]]-'a')^1],n2=nex[ans[p2]][(s[ans[p2]]-'a')^1];
        if(n1-ans[p1]<n2-ans[p2]||(n1-ans[p1]==n2-ans[p2]&&n1==n))
            tmp[cnt++]=ans[p1++];
        else if(n1-ans[p1]>n2-ans[p2]||(n1-ans[p1]==n2-ans[p2]&&n2==n))
            tmp[cnt++]=ans[p2++];
        else{
            if(rk[n1+1]<rk[n2+1])
                tmp[cnt++]=ans[p1++];
            else
                tmp[cnt++]=ans[p2++];
        }
    }
    while(p1<=mid)
        tmp[cnt++]=ans[p1++];
    while(p2<=r)
        tmp[cnt++]=ans[p2++];
    for(int i=l;i<=r;i++)ans[i]=tmp[i];
}
int main()
{
    while(~scanf("%d",&n)){
        scanf("%s",s);
        int p[3];
        p[1]=p[0]=-1;
        for(int i=0;i<n;i++){
            if(~p[s[i]-'a'])
                a[i]=i-p[s[i]-'a']+1;
            else
                a[i]=1;
            p[s[i]-'a']=i;
            ans[i]=i;
        }
        nex[n][0]=nex[n][1]=n;
        for(int i=n-1;~i;i--){
            nex[i][s[i]-'a']=i;
            nex[i][(s[i]-'a')^1]=nex[i+1][(s[i]-'a')^1];
        }
        a[n]=0;
        rk[n]=0;
        build_sa(a,sa,n+1,n+10);
        calheight(a,sa,n);
        merge(0,n-1);
        for(int i=0;i<n;i++)
            printf("%d%c",ans[i]+1,i==n-1?'\n':' ');
    }
    return 0;
}

你可能感兴趣的:(想法,后缀数组)