hdu 3065 病毒侵袭持续中(ac自动机)

Description

小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
 

Input

第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1―50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。 
 

Output

按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。 
病毒特征码: 出现次数 
冒号后有一个空格,按病毒特征码的输入顺序进行输出。 
 

Sample Input

     
     
     
     
3 AA BB CC ooxxCC%dAAAoen....END
 

Sample Output

     
     
     
     
AA: 2 CC: 1

Hint

 Hit: 题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。 计数策略也可一定程度上从Sample中推测。


注意字符串范围只为大写字母!另外每次匹配失败后要从根节点重新匹配!

#include <iostream>
#include <algorithm>
#include <stdio.h>
#include <string.h>
#include <string>
using namespace std;

#define kind 26
#define N 1005
#define M 2000005

int head, tail;
char keyword[N][55],str[M];
int k[N];
struct node
{
    node *fail;
    node *next[kind];
    int id,count;
    node() //init
    {
        fail = NULL;
        count=0;
        id=0;
        for(int i = 0; i <kind; ++i)
            next[i] = NULL;
    }
}*q[500000];
node *root;

void insert(char *str,int num) //建立Trie
{
    int temp, len;
    node *p = root;
    len = strlen(str);
    for(int i = 0; i < len; ++i)
    {
        temp = str[i] - 'A';//注意:字符串只包含“英文大写字符”
        if(p->next[temp] == NULL)
            p->next[temp] = new node();
        p = p->next[temp];
    }
    p->id=num;
    p->count++;
}

void build_ac() //初始化fail指针,BFS
{
    q[tail++] = root;
    while(head != tail)
    {
        node *p = q[head++]; //弹出队头
        node *temp = NULL;
        for(int i = 0; i < kind; ++i)
        {
            if(p->next[i] != NULL)
            {
                if(p == root) //第一个元素fail必指向根
                    p->next[i]->fail = root;
                else
                {
                    temp = p->fail; //失败指针
                    while(temp != NULL) //2种情况结束:匹配为空or找到匹配
                    {
                        if(temp->next[i] != NULL) //找到匹配
                        {
                            p->next[i]->fail = temp->next[i];
                            break;
                        }
                        temp = temp->fail;
                    }
                    if(temp == NULL) //为空则从头匹配
                        p->next[i]->fail = root;
                }
                q[tail++] = p->next[i]; //入队
            }
        }
    }
}

void query(char *str) //扫描
{
    int index,len;
    node *p = root; //Tire入口
    len = strlen(str);
    for(int i = 0; i < len; ++i)
    {
        if(str[i]>='A'&&str[i]<='Z')
        {
            index = str[i]-'A';//注意:字符串只包含“英文大写字符”
            while(p->next[index] == NULL && p != root) //跳转失败指针
                p = p->fail;
            p = p->next[index];
            if(p == NULL)
                p = root;
            node *temp = p; //p不动,temp计算后缀串
            while(temp != root&&temp->count>0)
            {
                k[temp->id]++;
                temp = temp->fail;
            }
        }
        else p=root;//不满足则从头开始!!
    }
}

int main()
{
    int n;
    while(scanf("%d",&n)!=EOF)
    {
        head= tail = 0;
        root = new node();

        memset(k,0,sizeof(k));
        for(int i=1; i<=n; i++)
        {
            scanf("%s",keyword[i]);
            insert(keyword[i],i);
        }
        build_ac();

        scanf("%s", str);
        query(str);

        for(int i=1; i<=n; i++)
        {
            if(k[i]>0)
                printf("%s: %d\n",keyword[i],k[i]);
        }
    }
    return 0;
}


你可能感兴趣的:(hdu 3065 病毒侵袭持续中(ac自动机))