spoj 7258 Lexicographical Substring Search (后缀自动机+dp)

题意:

给出一个串,q个询问,每个询问求第k大字典序的子串。

题解:

高了好久,终于对后缀自动机略有了解了。这题我们根据自动机中len的大小排序,为的是统计各个子串出现次数做准备,为什么要统计次数呢?自动机存的一个字典图,如果能得到通过某个点能达到其他点的路径数,就可以根据路径数来得到字典序的信息,具体做法是: 1、首先我们定义dp[node]表示经过node这个节点能达到其他节点的路径数。2、从0也就是根节点开,不断往下找,令now表示现在的节点p表示下个节点,k是字典序,分两种情况 (1)dp[p]+1>=k 这种情况说明这个子节点p有大于k的路径,那么k大的字典序子串肯定在这条路上于是now=p k--,同是输出对应的字母

(2)dp[p]+1<k  这个情况和上个情况相反,那么要从另外的路找了,于是k-=dp[p]+1,好好理解这句话。 

循环上面的两步就可以输出k大的子串。

对于dp的算法,我们要先根据len排序,然后从尾开始地推到根部。这样做竟然超市,无语了。不知道哪里写错了,我连缩点这个优化都写了还是TL。

#include<iostream>
#include<math.h>
#include<stdio.h>
#include<algorithm>
#include<string.h>
#include<vector>
#include<queue>
#include<map>
#include<set>
using namespace std;
#define B(x) (1<<(x))
typedef long long ll;
const int oo=0x3f3f3f3f;
const ll OO=1LL<<61;
const int MOD=10007;
const int maxn=90009;
const int SIZE=maxn<<1;
const int type=26;
char str[maxn],path[SIZE];
int next[SIZE][type],fa[SIZE],len[SIZE];
int tol,last;
int dp[SIZE<<1],pos[SIZE],cnt[SIZE];

int newNode(int x){

    len[tol]=x;
    fa[tol]=-1;
    for(int i=0;i<type;i++)
        next[tol][i]=-1;
    return tol++;
}

void Init(){

    tol=0;
    last=newNode(0);
}

void add(int k){

    int now=last;
    int end=newNode(len[now]+1);
    while(now!=-1&&next[now][k]==-1){

        next[now][k]=end;
        now=fa[now];
    }
    if(now==-1) fa[end]=0;
    else{

        int nxt=next[now][k];
        if(len[nxt]==len[now]+1) fa[end]=nxt;
        else{

            int cnxt=newNode(len[now]+1);
            for(int i=0;i<type;i++)next[cnxt][i]=next[nxt][i];
            fa[cnxt]=fa[nxt];
            fa[nxt]=fa[end]=cnxt;
            while(now!=-1&&next[now][k]==nxt){
                next[now][k]=cnxt;
                now=fa[now];
            }
        }
    }
    last=end;
}

void Insert(char T[]){

    int L=strlen(T);
    for(int i=0;i<L;i++){
        add(T[i]-'a');
    }
}

void MySort(){

    for(int i=0;i<tol;i++)cnt[i]=0;
    for(int i=0;i<tol;i++)cnt[len[i]]++;
    for(int i=1;i<tol;i++)cnt[i]+=cnt[i-1];
    for(int i=tol-1;i>=0;i--)pos[--cnt[len[i]]]=i;
}

void DP(){

    int now,k;
    for(int i=tol-1;i>=0;i--){

        now=pos[i];
        k=0;
        for(int j=0;j<type;j++){

            if(next[now][j]!=-1){

                dp[now]+=dp[next[now][j]]+1;
                next[now][k++]=next[now][j];///缩掉无用的点
                path[next[now][j]]=j+'a';
            }
        }
        next[now][k]=-1;
    }
}

void output(int k){

    int now=0;
    while(k){

        for(int i=0;next[now][i]!=-1;i++){

            int p=next[now][i];
            if(dp[p]+1>=k){

                k--;
                now=p;
                printf("%c",path[p]);
                break;

            }else k-=dp[p]+1;
        }
    }
    puts("");
}

int main(){

    int q,k;
    while(scanf("%s",str)!=EOF){

        Init();
        Insert(str);
        MySort();
        DP();

        scanf("%d",&q);
        while(q--){

            scanf("%d",&k);
            output(k);
        }
    }
    return 0;
}




你可能感兴趣的:(spoj 7258 Lexicographical Substring Search (后缀自动机+dp))