AC自动机 hdu 2222

。。完全学习两位牛人的。。有链接 自己转过去看吧

//AC自动机 HDU 2222  参考

//http://www.cppblog.com/mythit/archive/2009/07/30/80633.html

//http://www.cnblogs.com/destinydesigner/archive/2009/10/15/1584191.html

#include <iostream>

using namespace std;





const int kind = 26; 

struct node{  

	node *fail;       //失败指针

	node *next[kind]; //Tire每个节点的个子节点(最多个字母)

	int count;        //是否为该单词的最后一个节点

	node(){           //构造函数初始化

		fail=NULL; 

		count=0; 

		memset(next,NULL,sizeof(next)); 

	} 

}*q[500001];          //队列,方便用于bfs构造失败指针

char keyword[51];     //输入的单词

char str[1000001];    //模式串

int head,tail;        //队列的头尾指针







void insert(char *str,node *root)

{ 

	int i=0,index;  

	node *p=root; 

	while(str[i])

	{ 

		index=str[i]-'a'; 

		if(p->next[index]==NULL) 

			p->next[index]=new node();  

		p=p->next[index];

		i++;

	} 

	p->count++;     //在单词的最后一个节点count+1,代表一个单词

}



/*

假设有一个节点k,他的失败指针指向j。那么k,j满足这个性质:

设root到j的距离为n,则从k之上的第n个节点到k所组成的长度为n的单词,与从root到j所组成的单词相同。



那么我们要怎样构建这个东西呢?其实我们可以用一个简单的BFS搞定这一切。

对于每个节点,我们可以这样处理:

设这个节点上的字母为C,沿着他父亲的失败指针走,直到走到一个节点,他的儿子中也有字母为C的节点。

然后把当前节点的失败指针指向那个字母也为C的儿子。如果一直走到了root都没找到,那就把失败指针指向root



最开始,我们把root加入队列(root的失败指针显然指向自己),这以后我们每处理一个点,就把它的所有儿子加入队列,直到搞完。

*/

void build_ac_automation(node *root){

	int i;

	root->fail = NULL; 

	q[head++] = root; 

	while(head != tail)

	{ 

		node *temp = q[tail++]; 

		node *p = NULL; 

		for(i=0; i < 26; i++)

		{ 

			if(temp->next[i] != NULL)

			{ 

				if(temp==root) 

					temp->next[i]->fail = root;                 

				else

				{ 

					p = temp->fail; 

					while(p!=NULL)

					{  

						if(p->next[i]!=NULL)

						{ 

							temp->next[i]->fail=p->next[i]; 

							break; 

						} 

						p=p->fail; 

					} 

					if(p==NULL) 

						temp->next[i]->fail=root; 

				} 

				q[head++]=temp->next[i];//头指针后移

			} 

		}   

	} 

}









/*

匹配过程分两种情况:

(1)当前字符匹配,表示从当前节点沿着树边有一条路径可以到达目标字符,

此时只需沿该路径走向下一个节点继续匹配即可,目标字符串指针移向下个字符继续匹配;

(2)当前字符不匹配,则去当前节点失败指针所指向的字符继续匹配,

匹配过程随着指针指向root结束。

重复这2个过程中的任意一个,直到模式串走到结尾为止。

*/

/*

对于Trie树中的一个节点,对应一个序列s[1...m]。此时,p指向字符s[m]。

若在下一个字符处失配,即p->next[s[m+1]] == NULL,则由失配指针跳到另一个节点(p->fail)处,该节点对应的序列为s[i...m]。

若继续失配,则序列依次跳转直到序列为空或出现匹配。

在此过程中,p的值一直在变化,但是p对应节点的字符没有发生变化。

在此过程中,我们观察可知,最终求得得序列s则为最长公共后缀。

另外,由于这个序列是从root开始到某一节点,则说明这个序列有可能是某些序列的前缀。

再次讨论p指针转移的意义。

如果p指针在某一字符s[m+1]处失配(即p->next[s[m+1]] == NULL),则说明没有单词s[1...m+1]存在。

此时,如果p的失配指针指向root,则说明当前序列的任意后缀不会是某个单词的前缀。

如果p的失配指针不指向root,则说明序列s[i...m]是某一单词的前缀,于是跳转到p的失配指针,以s[i...m]为前缀继续匹配s[m+1]。

对于已经得到的序列s[1...m],由于s[i...m]可能是某单词的后缀,s[1...j]可能是某单词的前缀,所以s[1...m]中可能会出现单词。

此时,p指向已匹配的字符,不能动。于是,令temp = p,然后依次测试s[1...m], s[i...m]是否是单词。

*/

int query(node *root){ 

	int i=0,cnt=0,index,len=strlen(str); 

	node *p=root;  

	while(str[i]){  

		index=str[i]-'a';  

		while(p->next[index]==NULL && p!=root) //最长后缀

			p=p->fail; 

		p=p->next[index]; 

		p=(p==NULL)?root:p; 

		node *temp=p; 

		while(temp!=root){ //统计其中的单词

			cnt+=temp->count; 

			temp->count=0; 

			temp=temp->fail; 

		} 

		i++;                 

	}    

	return cnt; 

}







int main(){ 

	int n,t; 

	scanf("%d",&t); 

	while(t--){  

		head=tail=0; 

		node *root=new node(); 

		scanf("%d",&n); 

		getchar(); 

		while(n--){ 

			gets(keyword); 

			insert(keyword,root); 

		} 

		build_ac_automation(root); 

		scanf("%s",str); 

		printf("%d\n",query(root));  

	} 

	return 0; 

}

你可能感兴趣的:(AC自动机)