链接:点击打开链接
题意:t组数据,给出n个单词,再给一句话,问这句话中出现过几个给出的单词
代码:
#include <iostream> #include <stdio.h> #include <algorithm> #include <math.h> #include <stdlib.h> #include <queue> #include <string.h> using namespace std; struct node{ int str[26],fail; short dis; }ch[250005]; //这道题的内存卡的特别死,必须开成结构体,不能开成二维数组 int root; //而且强行改成short才不MLE void insert(char *s){ int u=0; for(;*s;s++){ if(!ch[u].str[*s-'a']) ch[u].str[*s-'a']=root++; u=ch[u].str[*s-'a']; } ch[u].dis++; //构造一颗字典树 } void getfail(){ //AC自动机就是在字典树上实现KMP,因此要有一个像KMP中next数组一样的东西 int u,v,i,temp; //因此产生了fail指针,代表匹配失败后移动的方向,我认为fail数组的含义就是 queue<int>q; //找一个最长的后缀,并且这个后必须是其它串的前缀(从第一个字符开始和从查 while(!q.empty())q.pop(); //找的那个字符往后同时比较相同"个数"的字符直到不相等时叫做前缀), q.push(0); //初始化队列 while(q.size()){ u=q.front();q.pop(); //就是bfs搜索找到每个节点的fail值 for(i=0;i<26;i++) if(v=ch[u].str[i]){ //找哪个字符是在字典树上的 if(u==0) //根节点下所连的fail值皆为0,因为与根节点直接相连的不可能有重复的字母,因此 ch[v].fail=0; //一旦匹配失败直接移动到根节点 else{ temp=ch[u].fail; //u表示当前字符在字典树中的状态 while(temp&&!ch[temp].str[i]) //当u的fail指针不为零时,也就是说状态为u的字符有对应的前缀与之匹配时,但是 temp=ch[temp].fail; //ch[temp].str[i]为零,则意味着与状态为u的字符匹配的字符的下一位与状态为u ch[v].fail=ch[temp].str[i]; //的字符的下一位不匹配,所以继续沿着fail指针走,然后将最终的值付给v所对应的 } //fail指针 q.push(v); //v入列继续搜索 } } } int acauto(char *s){ //这个函数就是匹配的函数,也就会用到fail指针 int sum,temp,star; sum=temp=0; for(;*s;s++){ while(temp&&!ch[temp].str[*s-'a']) //这步在第一次循环时不会用到,与得到fail指针时相似,就是状态为temp的字符所指向的 temp=ch[temp].fail; //下一个字符并不存在,沿着fail指针移动,找到尽可能能匹配的 star=temp=ch[temp].str[*s-'a']; //将第一个字符的初始状态赋给temp和star while(ch[star].dis){ sum+=ch[star].dis; ch[star].dis=0; //假如有完整的字符串出现,则加上个数 star=ch[star].fail; //之后沿着fail指针移动,也就是说看已经匹配的后缀还有没有可能出现以这个后缀为 } //前缀的其它字符串,也就是fail指针的意义所在 // sum+=ch[ch[star].fail].dis; //注释掉的这两行,网上很多版本是有这两行代码的,但我认为当单词不匹配的时候一定 // ch[ch[star].fail].dis=0; //不会再出现能够匹配的单词,因为与根节点相连的一定不会出现同样的字母 } return sum; } int main(){ int t,i,n; char s[60],temp[1000005]; scanf("%d",&t); while(t--){ memset(ch,0,sizeof(ch)); //初始化字典树 root=1; scanf("%d",&n); getchar(); for(i=0;i<n;i++){ scanf("%s",s); insert(s); } // for(i=0;i<10;i++){ //可以看看字典树是怎么连接的 // for(int j=0;j<26;j++) // cout<<ch[i].str[j]; // cout<<endl; // } getfail(); scanf("%s",temp); printf("%d\n",acauto(temp)); } //我也是初学AC自动机,看了好多版本的模板,选了一个我自己认为好理解的 return 0; //希望能够帮到别人,并且有说的不对的地方也欢迎评论指正 }