【AC自动机】 hdu3065 病毒侵袭持续中

病毒侵袭持续中

http://acm.hdu.edu.cn/showproblem.php?pid=3065



Problem Description
小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
 

Input
第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
 

Output
按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。
 

Sample Input
   
   
   
   
3 AA BB CC ooxxCC%dAAAoen....END
 

Sample Output
   
   
   
   
AA: 2 CC: 1

题意:给你一些字符串,再给你一个长字符串,问之前的那些字符串分别出现过几次,按输入的顺序输出字符串和其出现次数。

题解:AC自动机模板题,但是长字符串中会出现非大写字母的,此时只要判断到非大写字母就把指针返回根节点即可,最后统计的时候可以用map方便点。


#include<cstdio>
#include<cstring>
#include<string>
#include<queue>
#include<map>
#include<algorithm>
using namespace std;
struct node
{
    node *next[26],*fail;
    int id;
    node()
    {
        memset(next,0,sizeof(next));
        fail=NULL;
        id=0;
    }
}*head;
struct code
{
    string virus;
    int times;
}temp;
map<int,code> mapt;
map<int,string> maps;
void build(char *x,node *head,int id)
{
    //printf("build\n");
    int l=strlen(x);
    for(int i=0; i<l; ++i)
    {
        int k=x[i]-'A';
        if(head->next[k]==NULL)
            head->next[k]=new node();
        head=head->next[k];
    }
    head->id=id;
}
void build_fail(node *head)
{
    //printf("build_fail\n");
    node *now,*p;
    queue<node*> q;
    head->fail=NULL;
    q.push(head);
    for(; !q.empty();)
    {
        now=q.front();
        q.pop();
        for(int i=0; i<26; ++i)
            if(now->next[i])
            {
                p=now->fail;
                for(; p&&!p->next[i]; p=p->fail);
                now->next[i]->fail=p?p->next[i]:head;
                q.push(now->next[i]);
            }
    }
}
void ac_find(char *s,node *head)
{
    //printf("ac_find %s\n",s);
    int len=strlen(s);
    node *p=head;
    for(int i=0;i<len;++i)
    {
        if(s[i]<'A'||'Z'<s[i])
        {
            p=head;//这句不能少
            continue;
        }
        int k=s[i]-'A';
        for(;p->next[k]==NULL&&p!=head;p=p->fail);
        p=p->next[k]==NULL?head:p->next[k];
        node *tmp=p;
        for(;tmp!=head;)
        {
            if(tmp->id)
            {
                if(mapt.count(tmp->id))
                {
                    mapt.find(tmp->id)->second.times++;
                }
                else
                {
                    temp.times=1;
                    temp.virus=string(maps.find(tmp->id)->second);
                    mapt.insert(make_pair(tmp->id,temp));
                }
            }
            tmp=tmp->fail;
        }
    }
}
char t[55],s[2000005];
int main()
{
    int n;
    for(; ~scanf("%d",&n);)
    {
        mapt.clear();
        maps.clear();
        head=new node();
        for(int i=1; i<=n; ++i)
        {
            scanf("%s",t);
            maps.insert(make_pair(i,string(t)));
            build(t,head,i);
        }
        build_fail(head);
        scanf("%s",s);
        ac_find(s,head);
        for(map<int,code>::iterator it=mapt.begin();it!=mapt.end();++it)
            printf("%s: %d\n",it->second.virus.c_str(),it->second.times);
    }
    return 0;
}




你可能感兴趣的:(【AC自动机】 hdu3065 病毒侵袭持续中)