SPOJ NSUBSTR Substrings 后缀自动机

题目大意:

就是现在给出一个长度不超过25W的字符串S, 定义F(x)表示字符串S中长度为x的子串出现的最多次数, 例如“ababa"中F(1) = 3 (“a”出现了3次), F(2) = 2 ("ab“或者"ba"都出现了2次)

F(3) = 2 ("aba"出现了2次) F(4) = F(5) = 1, 对于给出的字符串S, 长度为n, 输出F(1~n)的值


大致思路:

首先对于字符串S建立后缀自动机, 然后由于每个状态 p 所代表的子串是一个区间长度[Min(p), Max(p)], 出现次数是状态p的Right集合大小, 那么在处理处后缀自动机之后, 问题变成了, 对于n次更新, 每次区间[Min(p), Max(p)]中比Right(p)小的数变成Right(p), 最后区间[1, n]中的值就是F[1~n], 但是这样的更新比较麻烦, 考虑Parent树的性质, 父亲节点的为par, 子节点是p的话, 那么par的right集合一定大于p的right集合, 并且Max(par) = Min(p)  + 1, 所以对于上面的[Min(p), Max(p)]的更新可以就当做是[1, Max(p)]的更新, 这样用dp[i]表示结果F[i]的话, 对于n次更新, 每次更新dp[Max(p)]的值, 最后dp[i ~ n]中的最大值就是F[i], 复杂度O(length(S))


代码如下:

Result  :  Accepted     Memory  :  68608 ms     Time  :  260 ms

/*
 * Author: Gatevin
 * Created Time:  2015/4/11 12:51:01
 * File Name: Rin_Tohsaka.cpp
 */
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;
#define foreach(e, x) for(__typeof(x.begin()) e = x.begin(); e != x.end(); ++e)
#define SHOW_MEMORY(x) cout<<sizeof(x)/(1024*1024.)<<"MB"<<endl

#define maxn 250010*2
#define maxm 250010


struct Suffix_Automation
{
    struct State
    {
        State *par;
        State *go[26];
        int val, mi, cnt, right;
        void init(int _val = 0)
        {
            par = 0, val = _val, cnt = mi = right = 0;
            memset(go, 0, sizeof(go));
        }
        int calc()
        {
            if(par == 0) return 0;
            return val - par->val;
        }
    };
    State *root, *last, *cur;
    State nodePool[maxn];
    State* newState(int val = 0)
    {
        cur->init(val);
        return cur++;
    }
    void initSAM()
    {
        cur = nodePool;
        root = newState();
        last = root;
    }
    void extend(int w)
    {
        State *p = last;
        State *np = newState(p->val + 1);
        np->right = 1;
        while(p && p->go[w] == 0)
        {
            p->go[w] = np;
            p = p->par;
        }
        if(p == 0)
        {
            np->par = root;
        }
        else
        {
            State *q = p->go[w];
            if(q->val == p->val + 1)
            {
                np->par = q;
            }
            else
            {
                State *nq = newState(p->val + 1);
                memcpy(nq->go, q->go, sizeof(q->go));
                nq->par = q->par;
                q->par = nq;
                np->par = nq;
                while(p && p->go[w] == q)
                {
                    p->go[w] = nq;
                    p = p->par;
                }
            }
        }
        last = np;
    }
    int d[maxm];
    State* b[maxn];
    void topo()
    {
        int maxVal = 0;
        memset(d, 0, sizeof(d));
        int cnt = cur - nodePool;
        for(int i = 1; i < cnt; i++)
            maxVal = max(maxVal, nodePool[i].val), d[nodePool[i].val]++;
        for(int i = 1; i <= maxVal; i++) d[i] += d[i - 1];
        for(int i = 1; i < cnt; i++) b[d[nodePool[i].val]--] = &nodePool[i];
        b[0] = root;
        return;
    }
    void SAMInfo()
    {
        State *p;
        int cnt = cur - nodePool;
        for(int i = cnt - 1; i > 0; i--)
        {
            p = b[i];
            p->par->right += p->right;
            p->mi = p->par->val + 1;
        }
        return;
    }  
};

Suffix_Automation sam;

char s[maxm];
int dp[maxn];

int main()
{
    //scanf("%s", s);
    gets(s);
    int len = strlen(s);
    sam.initSAM();
    for(int i = 0; i < len; i++)
        sam.extend(s[i] - 'a');
    sam.topo();
    sam.SAMInfo();
    int cnt = sam.cur - sam.nodePool;
    memset(dp, 0, sizeof(dp));
    for(int i = cnt - 1; i > 0; i--)//区间更新[1, b[i]->val]的话记录dp[b[i]->val]的最大值
        dp[sam.b[i]->val] = max(dp[sam.b[i]->val], sam.b[i]->right);
    for(int i = len - 1; i > 0; i--)//数组后缀dp[i ~ len]中的最大值就是dp[i]
        dp[i] = max(dp[i], dp[i + 1]);
    for(int i = 1; i <= len; i++)
        printf("%d\n", dp[i]);
    return 0;
}



你可能感兴趣的:(Substrings,spoj,后缀自动机,NSUBSTR)