hdu2896(ac自动机)

病毒侵袭

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 7628    Accepted Submission(s): 2005


Problem Description
当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
 

Input
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
 

Output
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
 

Sample Input
   
   
   
   
3 aaa bbb ccc 2 aaabbbccc bbaacc
 

Sample Output
   
   
   
   
web 1: 1 2 3 total: 1
 


此题是典型的多模式串匹配问题,ac自动机即可解决。我的ac自动机代码是套用的网上大牛的模板,然后自己结合题目做了一下修改,题目在几次RE之后终于AC了。总的时间复杂度为O(n*len(s)).

 

#include <iostream>
#include<algorithm>
using namespace std;

const int kind = 128;
struct node
{
	node *fail; //失败指针
	node *next[kind]; //Tire每个节点的26个子节点(最多26个字母)
	int count; //是否为该单词的最后一个节点
	node()
	{ //构造函数初始化
		fail=NULL;
		count=0;
		memset(next,NULL,sizeof(next));
	}
}*q[500*200+1000]; //队列,方便用于bfs构造失败指针,大小应依据Tries图节点个数而定

char keyword[200+20]; //输入的单词
char str[10000+10]; //模式串
int INdex[1000+10][5];
int num[1000+10];
int head,tail; //队列的头尾指针

void insert(char *str,node *root,int ind)
//建立一颗以root为根节点的不带前缀指针的字典树
{
	node *p=root;
	int i=0,index;
	while(str[i])
	{
		index=str[i];
		if(p->next[index]==NULL) 
			p->next[index]=new node();
		p=p->next[index];
		i++;
	}
	p->count=ind;
}


void build_ac_automation(node *root)
//在建好的字典树上添加前缀指针,形成Tries图,即ac自动机
{
	int i;
	root->fail=NULL;
	q[head++]=root;
	while(head!=tail)
	{
		node *temp=q[tail++];
		node *p=NULL;
		for(i=0;i<128;i++)
		{
			if(temp->next[i]!=NULL)
			{
				if(temp==root) 
					temp->next[i]->fail=root;
				else
				{
					p=temp->fail;
					while(p!=NULL)
					{
						if(p->next[i]!=NULL)
						{
							temp->next[i]->fail=p->next[i];
							break;
						}
						p=p->fail;
					}
					if(p==NULL) 
						temp->next[i]->fail=root;
				}
				q[head++]=temp->next[i];
			}
		}
	}
}

int query(node *root,int ind)
//有多少种模式串出现在母串str[]中
{
	int i=0,cnt=0,index,len=strlen(str),j;
	node *p=root;
	while(str[i])
	{
		index=str[i];
		while(p->next[index]==NULL && p!=root)
			p=p->fail;
		p=p->next[index];
		p=(p==NULL)?root:p;
		node *temp=p;
		while(temp!=root&&temp->count)
		{
			for(j=0;j<num[ind];j++)
				if(INdex[ind][j]==temp->count)
					break;
			if(j>=num[ind])
				INdex[ind][num[ind]++]=temp->count;

			temp=temp->fail;
		}
		i++;
	}
	return cnt;
}

int main()
{
	int n,t,i,m,j,tag;
	while(~scanf("%d",&n))
	{
		head=tail=0;
		node *root=new node();
		getchar();
		for(i=1;i<=n;i++)
		{
	    	gets(keyword);
		    insert(keyword,root,i);
		}
		build_ac_automation(root);
		scanf("%d",&m);
		getchar();
		memset(INdex,0,sizeof(INdex));
		memset(num,0,sizeof(num));
		for(i=1;i<=m;i++)
		{
			gets(str);
			query(root,i);
		}

		tag=0;
		for(i=1;i<=m;i++)
		{
			if(num[i])
			{
				tag++;
				printf("web %d:",i);
				sort(INdex[i],INdex[i]+num[i]);
				for(j=0;j<num[i]-1;j++)
					printf(" %d",INdex[i][j]);
				printf(" %d\n",INdex[i][j]);
			}
		}
		printf("total: %d\n",tag);
	}
	return 0;
}


 

你可能感兴趣的:(数据结构,AC自动机)