bzoj5137 [Usaco2017 Dec]Standing Out from the Herd(广义SAM)

首先不得不说,是在下输了。对于广义SAM的构建,蒟蒻之前还存在着很多误区。

广义SAM的构建与SAM的构建,主要区别就在于,当你插入一个字符时,可能根本就不会产生新的子串,也就根本不用新建一个节点。

什么情况下会发生这种情况?设p=last,要插入字符ch,如果已经存在son[p][ch],记为q,则一定不会产生新的子串(原来在SAM上就可以到达q,所以所有以ch结尾的子串均已存在),对于这种情况我们不能新建np节点!!!那怎么办呢?我们特判一下,如果mx[q]==mx[p]+1则直接返回q,否则新建nq节点取代q节点(因为虽然没有产生新的子串,但是根据我们对于广义SAM的Right集合的定义(在Trie树上的结束节点),他需要分裂开来。),返回nq。

只有这样构造的广义SAM才是真正正确的。至于为什么就算不特殊处理,构建出了错误的广义SAM也可以达到一样的效果呢:因为我们所谓的错误只不过是生成了一些“无用重复节点”,在parent树上就会出现这样的情况:mx[p]==mx[par[p]]。对于一些信息的统计其实是没有影响的,但是如果你要基数排序处理出parent树的拓扑关系,就会出问题,这时你必须让mx相同的节点标号小的排在前面。所以在放回去的时候必须正序处理。然而这样其实是不正确的,并不优美。

所以为了构建出正确的广义SAM,我们还是写程序时严谨一点吧:D

至于此题的解法:我们构建出广义SAM,然而对于每个节点染色,如果子树有多个颜色则直接标记-1.最后每个节点对答案的贡献就是
ans[col[x]]+=mx[x]-mx[par[x]]。

#include 
#include 
#include 
#include 
using namespace std;
#define ll long long
#define inf 0x3f3f3f3f
#define N 200010
inline int read(){
    int x=0,f=1;char ch=getchar();
    while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9') x=x*10+ch-'0',ch=getchar();
    return x*f;
}
int nn,last,rt,n=0,son[N][26],par[N],mx[N],col[N],cnt[N],a[N],ans[N];
char s[N];
inline void ins(int ch,int id){
    int p=last;
    if(son[p][ch]){
        int q=son[p][ch];
        if(mx[q]==mx[p]+1){col[q]=-1;last=q;return;}
        int nq=++n;mx[nq]=mx[p]+1;last=nq;col[nq]=-1;
        memcpy(son[nq],son[q],sizeof(son[q]));par[nq]=par[q];par[q]=nq;
        for(;p&&son[p][ch]==q;p=par[p]) son[p][ch]=nq;return;
    }int np=++n;last=np;mx[np]=mx[p]+1;col[np]=id;
    for(;p&&!son[p][ch];p=par[p]) son[p][ch]=np;
    if(!p){par[np]=rt;return;}
    int q=son[p][ch];if(mx[q]==mx[p]+1){par[np]=q;return;}
    int nq=++n;memcpy(son[nq],son[q],sizeof(son[q]));
    mx[nq]=mx[p]+1;col[nq]=0;par[nq]=par[q];par[q]=par[np]=nq;
    for(;p&&son[p][ch]==q;p=par[p]) son[p][ch]=nq;
}
int main(){
//  freopen("a.in","r",stdin);
    nn=read();rt=++n;
    for(int i=1;i<=nn;++i){
        scanf("%s",s+1);int len=strlen(s+1);last=1;
        for(int j=1;j<=len;++j) ins(s[j]-'a',i);
    }for(int i=1;i<=n;++i) cnt[mx[i]]++;
    for(int i=1;i<=n;++i) cnt[i]+=cnt[i-1];
    for(int i=n;i>=1;--i) a[cnt[mx[i]]--]=i;
    for(int i=n;i>=1;--i){
        int p=a[i];if(col[par[p]]==-1) continue;
        if(col[par[p]]){
            if(col[par[p]]==col[p]) continue;
            col[par[p]]=-1;continue;
        }col[par[p]]=col[p];
    }for(int i=1;i<=n;++i) if(col[i]!=-1) ans[col[i]]+=mx[i]-mx[par[i]];
    for(int i=1;i<=nn;++i) printf("%d\n",ans[i]);
    return 0;
}

你可能感兴趣的:(bzoj,SAM)