HDU 3065:病毒侵袭持续中(AC自动机)

病毒侵袭持续中

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 1662    Accepted Submission(s): 610


Problem Description
小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
 

Input
第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
 

Output
按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。
 

Sample Input
 
   
3
AA
BB
CC
ooxxCC%dAAAoen....END
 

Sample Output
 
   
AA: 2
CC: 1

源代码:

#include
#include
#include
using namespace std;

const int KIND=26;
const int MAXLEN=2000005;
const int MAX=1005;

int n,ans,cnt[MAX];
char word[MAX][55],str[MAXLEN];

struct TrieNode
{
	int num;
	TrieNode *fail;
	TrieNode *next[KIND];
	TrieNode()
	{
		num=0;
		fail=NULL;
		memset(next,0,sizeof(next));
	}
};


TrieNode *q[500005];//队列


void InsertTrieNode(TrieNode *pRoot,char s[],int number)
{
	TrieNode *p=pRoot;
	int i=0;
	while(s[i])
	{
		int k=s[i]-'A';
		if(p->next[k]==NULL)
			p->next[k]=new TrieNode();
		i++;
		p=p->next[k];
	}
	p->num=number;
}

void Build_AC_automation(TrieNode *pRoot)
{
	int head=0,tail=0,i;
	TrieNode *p;
	pRoot->fail=NULL;
	q[tail++]=pRoot;
	while(head!=tail)
	{
		p=q[head++];
		for(i=0;inext[i]!=NULL)
			{
				if(p==pRoot)
				    p->next[i]->fail=pRoot;
				TrieNode *tmp=p->fail;
				while(tmp!=NULL && tmp->next[i]==NULL)
					tmp=tmp->fail;
				if(tmp==NULL) p->next[i]->fail=pRoot;
				else
				    p->next[i]->fail=tmp->next[i]; 
				q[tail++]=p->next[i];
			}
	}
}

void Search(TrieNode *pRoot,char s[])
{
	int i,res=0;
	memset(cnt,0,sizeof(cnt));
	TrieNode *p,*tmp;
	p=pRoot;
	i=0;
	while(s[i])
	{
		if(s[i]>='A' && s[i]<='Z')
		{
		    int k=s[i++]-'A';
		    while(p->next[k]==NULL && p!=pRoot)
			      p=p->fail;
		     p=p->next[k];
		     if(p==NULL) p=pRoot;
		     tmp=p;
		     while(tmp!=pRoot)// 
		     {
			     if(tmp->num>0)
				 {
				      cnt[tmp->num]++;
				 }
			     tmp=tmp->fail;
		     }
		}
		else //碰到不是大写字母的,p返回到根
		{
			i++;
			p=pRoot;
		}
	}
	for(i=1;i<=n;i++)
		if(cnt[i]!=0)
			printf("%s: %d\n",word[i],cnt[i]);
}


int main()
{
	int i;
	TrieNode *pRoot=new TrieNode();
	while(scanf("%d",&n)!=EOF)
	{
		memset(pRoot->next,NULL,sizeof(pRoot->next));
		getchar();
		for(i=1;i<=n;i++)
		{
			gets(word[i]);
			InsertTrieNode(pRoot,word[i],i);
		}
		Build_AC_automation(pRoot);
		gets(str);
		Search(pRoot,str);
	}
	system("pause");
	return 0;
}


你可能感兴趣的:(字符串)