P2852 [USACO06DEC]Milk Patterns G (后缀数组height[]+单调队列)

题意:

给定长度为n的数组a,
要求计算出现至少 k 次的子串的最大长度

数据范围:n<=2e4,a(i)<=1e6

解法:

对数组a构造后缀数组,
后缀数组height的定义:
排名相邻的后缀的最长公共前缀

因为每个子串一定是某个后缀的前缀,前缀相同的一定相邻,
那么出现至少k次就意味着后缀排序后有至少连续k个后缀的LCP是这个子串。
那么计算height数组中所有长度为k-1的子段的最小值,对他们取max就是答案。

所有长度为k-1的子段最小值,是经典的滑动窗口题,可以用单调队列解决。
因此对height数组滑动窗口一下就行了。

ps:
单调队列是O(n)的,
如果要求不是那么高的话,可以写O(nlogn)的multiset,更好写一点。
具体操作是插入相邻的k-1个height,取min是set的基本操作
当size>=k的时候,删掉multiset中的height[i-k+1]就行了。
(其实就是用multiset实现尺取)

code:

#include
using namespace std;
const int maxm=1e5+5;
struct SA{
    static const int N=4e6+5;
//    char s[N];
    int s[N];
    int sa[N],rk[N],oldrk[N<<1],id[N],px[N],cnt[N];
    int ht[N];
    int n;//字符串长度
    int m=300;//初始字符集大小
    bool cmp(int x,int y,int w){
        return oldrk[x]==oldrk[y]&&oldrk[x+w]==oldrk[y+w];
    }
    void getSA(){
        int i,p,w;
        for(i=1;i<=n;i++)cnt[rk[i]=s[i]]++;
        for(i=1;i<=m;i++)cnt[i]+=cnt[i-1];
        for(i=n;i>=1;i--)sa[cnt[rk[i]]--]=i;
        //
        for(w=1;w<n;w<<=1,m=p){
            for(p=0,i=n;i>n-w;i--)id[++p]=i;
            for(i=1;i<=n;i++)if(sa[i]>w)id[++p]=sa[i]-w;
            memset(cnt,0,sizeof cnt);
            for(i=1;i<=n;i++)cnt[px[i]=rk[id[i]]]++;
            for(i=1;i<=m;i++)cnt[i]+=cnt[i-1];
            for(i=n;i>=1;i--)sa[cnt[px[i]]--]=id[i];
            memcpy(oldrk,rk,sizeof rk);
            for(p=0,i=1;i<=n;i++){
                rk[sa[i]]=cmp(sa[i],sa[i-1],w)?p:++p;
            }
        }
        //
//        for(int i=1;i<=n;i++)printf("%d ",sa[i]);
//        puts("");
    }
    void getHT(){
        for(int i=1,k=0;i<=n;i++){
            if(k)k--;
            while(s[i+k]==s[sa[rk[i]-1]+k])k++;
            ht[rk[i]]=k;
        }
    }
}sa;
signed main(){
    int n,k;scanf("%d%d",&n,&k);
    for(int i=1;i<=n;i++)scanf("%d",&sa.s[i]);
    sa.n=n;
    sa.m=1e6;
    sa.getSA();
    sa.getHT();
    deque<int>q;
    int ans=0;
    for(int i=2;i<=n;i++){
        while(!q.empty()&&q.front()<=i-k+1)q.pop_front();//去掉越界的
        while(!q.empty()&&sa.ht[q.back()]>=sa.ht[i])q.pop_back();//去掉非最小值
        q.push_back(i);
        if(i>=k){
            ans=max(ans,sa.ht[q.front()]);
        }
    }
    printf("%d\n",ans);
    return 0;
}

你可能感兴趣的:(P2852 [USACO06DEC]Milk Patterns G (后缀数组height[]+单调队列))