【NOI 2014】【BZOJ 3670】动物园 题解&代码(C++)

【NOI2014】动物园

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的园长决定开设算法班,让动物们学习算法。 某天,园长给动物们讲解KMP算法。

园长:“对于一个字符串SS它的长度为LL。我们可以在O(L)O(L)的时间内求出一个名为next的数组。有谁预习了next数组的含义吗?”

熊猫:“对于字符串SS的前ii个字符构成的子串,既是它的后缀又是它的前缀的字符串中,它本身除外,最长的长度记作 next[i]。”

园长:“非常好,那你能举个例子吗?”

熊猫:“例如SS为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出 next[1] = next[2] = next[3] = 0, next[4] = next[6] = 1, next[7] = 2, next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)O(L)的时间内求出next数组。下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组——对于字符串SS的前ii个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如SS为aaaaa,则num[4]=2。这是因为SS的前44个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’。但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1]=0,num[2]=num[3]=1,num[5]=2。”

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了。但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?

特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出 ∏Li=1(num[i]+1)∏i=1L(num[i]+1)对10000000071000000007取模的结果即可。

其中∏ni=1(num[i]+1)=(num[1]+1)×(num[2]+1)×⋯×(num[n]+1)∏i=1n(num[i]+1)=(num[1]+1)×(num[2]+1)×⋯×(num[n]+1)。
输入格式

输入文件的第1行仅包含一个正整数nn

表示测试数据的组数。 随后nn行,每行描述一组测试数据。

每组测试数据仅含有一个字符串SS,SS的定义详见题目描述。数据保证SS,中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
输出格式

输出文件应包含nn行

每行描述一组测试数据的答案

答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对1000000007取模的结果。

输出文件中不应包含多余的空行

样例一
input

3
aaaaa
ab
abcababc

output

36
1
32

测试点编号 约定
1 n≤5,L≤50n≤5,L≤50
2 n≤5,L≤200n≤5,L≤200
3 n≤5,L≤200n≤5,L≤200
4 n≤5,L≤10000n≤5,L≤10000
5 n≤5,L≤10000n≤5,L≤10000
6 n≤5,L≤100000n≤5,L≤100000
7 n≤5,L≤200000n≤5,L≤200000
8 n≤5,L≤500000n≤5,L≤500000
9 n≤5,L≤1000000n≤5,L≤1000000
10 n≤5,L≤1000000

题解:

首先题上对kmp做了一堆乱七八糟的介绍,其次这道题也的确是用kmp来做。了解nex数组的性质后发现,其实要找到num[i]的话只需要不断递归求nex[i],如果发现nex[i]不为-1,即在以i为结尾的字符串中,可以找到前缀与后缀相等的部分,那么num[i]++,接着找nex[nex[i]]如果发现仍不为-1,那么num[i]++,知道找到-1为止,在加之前再判断一下nex是否过半,即判断重叠之后再加,但很明显如果出一下特殊数据,
如aaaa….(若干个)….aaaaa,那么这个方法就会退化为n方的算法,这就需要对以上算法进行优化。
看到算num的过程我们可以发现,在递归nex的过程中会出现许多重复的操作,而且num好像可以通过之前求得的num递推出来,但仔细思考后发现递推最终的num是没有办法的,因此我们不妨在原定义的基础上简化一下,定义为“可重叠的既是后缀又是前缀的子串个数”,这样的话 伪num的递推过程就会简单许多,可以在求nex的过程中就将伪num求出来,即
伪num[i]=伪num[nex[i]]+1
这样的话可以发现实际上的num[i]=num[j]且j需要满足 j<=i/2,j=nex[nex[nex..i.]]],(不定数个nex),但是即使这样也会存在超时现象,因此我们需要存一下i-1时所找到的j,下次在直接用j+1来进行比较和回溯,不过想要完全ac似乎要用快乘,虽然不用快乘也可以ac,但那组最大的样例过不了即uoj上的样例2.

代码:

#include<iostream>
#include<algorithm>
#include<stdio.h>
#include<string.h>
#define Mod (1000000007) 
using namespace std;
char s[1000005];
long long ans;
int len,n,nex[1000005],num[1000005];
void getnex()
{
    int j=-1;
    num[0]=1;
        nex[0]=-1;
    for (int i=0;i<len;i++)
    {
        while( j!=-1 && s[j+1]!=s[i] ) j=nex[j];
        if (s[j+1]==s[i] && i!=0) j++;
        nex[i]=j;
        if (j!=-1) num[i]=num[j]+1;
        else num[i]=1;
    }
}
void solve()
{
    int j=-1;
    for (int i=0;i<len;i++)
    {
        while(j!=-1 && s[j+1]!=s[i] )   j=nex[j];
        if (s[j+1]==s[i] && i!=0)   j++;
        if (j+1>(i+1)/2 && j!=-1)   j=nex[j];
        if (j!=-1) ans=(ans*(num[j]+1)%Mod)%Mod;
    }
}
int main()
{
    scanf("%d",&n);
    for (int w=1;w<=n;w++)
    {
        ans=1;
        memset(num,0,sizeof(num));
        scanf("%s",s);
        len=strlen(s);
        getnex();
        solve();
        printf("%lld\n",ans);
    }
}

你可能感兴趣的:(算法,KMP,NOI,uoj)