bzoj 4212: 神牛的养成计划 (trie+可持久化trie)

4212: 神牛的养成计划

Time Limit: 10 Sec   Memory Limit: 512 MB
Submit: 112   Solved: 25
[ Submit][ Status][ Discuss]

Description

Hzwer成功培育出神牛细胞,可最终培育出的生物体却让他大失所望......
后来,他从某同校女神 牛处知道,原来他培育的细胞发生了基因突变,原先决定神牛特征的基因序列都被破坏了,神牛hzwer很生气,但他知道基因突变的低频性,说不定还有以下优秀基因没有突变,那么他就可以用限制性核酸内切酶把它们切出来,然后再构建基因表达载体什么的,后面你懂的......
黄学长现在知道了N个细胞的DNA序列,它们是若干个由小写字母组成的字符串。一个优秀的基因是两个字符串s1和s2,当且仅当s1是某序列的前缀的同时,s2是这个序列的后缀时,hzwer认为这个序列拥有这个优秀基因。
现在黄学长知道了M个优秀基因s1和s2,它们想知道对于给定的优秀基因,有多少个细胞的DNA序列拥有它。

Input

第一行:N,表示序列数
接下来N行,每行一个字符串,代表N个DNA序列,它们的总长为L1
接下来一个M,表示询问数
接下来M行,每行两个字符串s1和s2,由一个空格隔开,hzwer希望你能在线回答询问,所以s1等于“s1”的所有字符按字母表的顺序向后移动ans位(字母表是一个环),ans为上一个询问的答案,s2同理。例如ans=2  “s1”=qz
则s1=sb。对于第一个询问,ans=0
s1和s2的总长度为L2

Output

输出M行,每行一个数,第i行的数表示有多少个序列拥有第i个优秀基因。

Sample Input

10
emikuqihgokuhsywlmqemihhpgijkxdukjfmlqlwrpzgwrwozkmlixyxniutssasrriafu
emikuqihgokuookbqaaoyiorpfdetaeduogebnolonaoehthfaypbeiutssasrriafu
emikuqihgokuorocifwwymkcyqevdtglszfzgycbgnpomvlzppwrigowekufjwiiaxniutssasrriafu
emikuqihgokuorociysgfkzpgnotajcfjctjqgjeeiheqrepbpakmlixyxniutssasrriafu
emikuqihgokuorociysgfrhulymdxsqirjrfbngwszuyibuixyxniutssasrriafu
emikuqihgokuorguowwiozcgjetmyokqdrqxzigohiutssasrriafu
emikuqihgokuorociysgsczejjmlbwhandxqwknutzgdmxtiutssasrriafu
emikuqihgokuorociysgvzfcdxdiwdztolopdnboxfvqzfzxtpecxcbrklvtyxniutssasrriafu
emikuqihgokuorocsbtlyuosppxuzkjafbhsayenxsdmkmlixyxniutssasrriafu
emikuqihgokuorociysgfjvaikktsixmhaasbvnsvmkntgmoygfxypktjxjdkliixyxniutssasrriafu
10
emikuqihgokuorociysg yxniutssasrriafu
aiegqmedckgqknky eqpoowonnewbq
xfbdnjbazhdnhkhvb qrqgbnmlltlkkbtyn
bjfhrnfedlhrlolzfv qppxpoofxcr
zhdfpldcbjf stsidponnvnmmdvap
zhdfpldcbjfpjmjxdt gdstsidponnvnmmdvap
dlhjtphgfnjtnqnbhxr wxwmhtsrrzrqqhzet
bjfhrnfedlhrlolzfv frqppxpoofxcr
zhdfpldcbjf dponnvnmmdvap
ucyakgyxweakehes nondykjiiqihhyqvk

Sample Output

4
7
3
5
5
1
3
5
10
4

HINT

N<=2000

L1<=2000000

M<=100000

L2<=2000000

Source

[ Submit][ Status][ Discuss]

题解:trie+可持久化trie

今天的互测题,感觉是道不错的字符串题,不过非官方数据较水,可以用hash过掉。

首先对于读入的字符串排序,然后按照顺序加入trie,对于trie中的每个节点都维护一下排序后的那一段区间可以到达这个点(就是那一段的前缀可以匹配到这里)。

然后按照排好的顺序将每个串反过来,建立可持久化trie。

对于每个询问,我们用前缀在trie上匹配,得到一段合法的区间[l,r],然后在可持久化trie上查询[l,r]区间中可以匹配上的后缀的数量即可。

#include
#include
#include
#include
#include
#define N 2000003
using namespace std;
int n,cnt,m,sz,tot,x[N],b[N],c[N]; 
int a[N],ch[N][27],ch1[N][27],size[N],root[N],ls[N],rs[N],l[N],r[N];
char s[N],s1[N],s2[N];
int cmp(int x,int y)
{
	int len=min(r[x]-l[x]+1,r[y]-l[y]+1);
	for (int i=0;i=l;i--) {
		int x=a[i];
		size[now]=size[pre]+1;
		ch1[now][x]=++tot;
		for (int j=1;j<=26;j++)
		 if (j!=x) ch1[now][j]=ch1[pre][j];
		now=ch1[now][x]; pre=ch1[pre][x];
	}
	size[now]=size[pre]+1;
}
int get_pos()
{
	int len=strlen(s1+1);
	int now=0;
	for (int i=1;i<=len;i++) {
		int x=b[i];
		now=ch[now][x];
		if (!now) return -1;
	}
	return now;
}
int find(int i,int j)
{
	int len=strlen(s2+1); 
	bool pd=false;
	for (int k=len;k>=1;k--) {
		int x=c[k];
		if (!pd&&size[ch1[i][x]]==size[ch1[j][x]]||!size[ch1[j][x]]) return 0;
		//cout<



你可能感兴趣的:(字符串处理,主席树)