HDU 2896:病毒侵袭(AC自动机)

病毒侵袭

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 2460    Accepted Submission(s): 635


Problem Description
当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
 

Input
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
 

Output
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
 

Sample Input
   
   
   
   
3
aaa
bbb
ccc
2
aaabbbccc
bbaacc
 

Sample Output
   
   
   
   
web 1: 1 2 3
total: 1


源代码:(171MS)

#include<iostream>
#include<algorithm>
#include<string.h>
using namespace std;

const int KIND=100;
const int MAX=10005;

int n,m,ans,visit[100000];//visit[]标志已记录的结点
int allocp=0;

struct TrieNode
{
	int *vis,num; 
	TrieNode *fail;
	TrieNode *next[KIND];
	TrieNode()
	{
		vis=&visit[allocp++];//指针指向visit数组
		num=0;
		fail=NULL;
		memset(next,0,sizeof(next));
	}
};


TrieNode *q[500005];//队列


void InsertTrieNode(TrieNode *pRoot,char s[],int number)
{
	TrieNode *p=pRoot;
	int i=0;
	while(s[i])
	{
		int k=s[i]-32;
		if(p->next[k]==NULL)
			p->next[k]=new TrieNode();
		i++;
		p=p->next[k];
	}
	p->num=number;
}

void Build_AC_automation(TrieNode *pRoot)
{
	int head=0,tail=0,i;
	TrieNode *p;
	pRoot->fail=NULL;
	q[tail++]=pRoot;
	while(head!=tail)
	{
		p=q[head++];
		for(i=0;i<KIND;i++)
			if(p->next[i]!=NULL)
			{
				if(p==pRoot)
				    p->next[i]->fail=pRoot;
				TrieNode *tmp=p->fail;
				while(tmp!=NULL && tmp->next[i]==NULL)
					tmp=tmp->fail;
				if(tmp==NULL) p->next[i]->fail=pRoot;
				else
				    p->next[i]->fail=tmp->next[i]; 
				q[tail++]=p->next[i];
			}
	}
}

void Search(TrieNode *pRoot,char s[],int webNum)
{
	int i,res=0,cnt[3];
	TrieNode *p,*tmp;
	p=pRoot;
	i=0;
	while(s[i])
	{
		int k=s[i++]-32;
		while(p->next[k]==NULL && p!=pRoot)
			p=p->fail;
		p=p->next[k];
		if(p==NULL) p=pRoot;
		tmp=p;
		while(tmp!=pRoot&& *(tmp->vis)!=-1)// 
		{
			if(tmp->num>0)
				cnt[res++]=tmp->num;
			*(tmp->vis)=-1;      //搜索过
			tmp=tmp->fail;
		}
	}
	if(res)
	{
		ans++;
		sort(cnt,cnt+res);
		printf("web %d:",webNum);
		for(i=0;i<res;i++)
			cout<<" "<<cnt[i];
		cout<<endl;
	}
}

void Reset()//为下一个网站重置vis
{
	for(int i=0;i<allocp;i++)
		visit[i]=2;
}

int main()
{
	int i,j;
	TrieNode *pRoot=new TrieNode();
	char word[205],s[MAX];
	while(scanf("%d",&n)!=EOF)
	{
		memset(pRoot->next,NULL,sizeof(pRoot->next));
		allocp=1;
		getchar();
		for(i=1;i<=n;i++)
		{
			gets(word);
			InsertTrieNode(pRoot,word,i);
		}
		Build_AC_automation(pRoot);
		scanf("%d",&m);
		ans=0;
		getchar();
		for(i=1;i<=m;i++)
		{
			gets(s);
			Reset();
			Search(pRoot,s,i);
		}
		cout<<"total: "<<ans<<endl;
	}
	system("pause");
	return 0;
}


你可能感兴趣的:(struct,null,search,input,Build,output)