UVaLA 4670 Dominating Patterns AC自动机

UVaLA 4670 Dominating Patterns AC自动机_第1张图片

点击打开题目链接


AC自动机,需要对 Trie 和 KMP 有一定的了解。

#include <cstdio>
#include <cstring>
#include <map>
#include <queue>
#include <iostream>
using namespace std;

const int TEXT_SIZE = 1000000 + 10;
const int SIGMA_SIZE = 26;
const int P_NUM = 150 + 10;
const int p_SIZE = 70 + 10;
const int MAXNODE = 20000;
map<string, int> ms;

struct AhoCorasickAutomata
{
    int sz;         //结点总数
    int cnt[P_NUM];
    int f[MAXNODE], last[MAXNODE], ch[MAXNODE][SIGMA_SIZE];
    int val[MAXNODE];

    int idx(char c)    //字符 c 的编号
    {
        return c - 'a';
    }

    void Init()     //初始化
    {
        sz = 1;
        memset(ch[0], 0, sizeof(ch[0]));
        memset(cnt, 0, sizeof(cnt));
        ms.clear();
    }
    //插入字符串 s,附件信息为 v。注意 v 必须非0,因为0代表“本结点不是单词结点”
    void Insert(char* s, int v)
    {
        int u = 0, n = strlen(s);
        for (int i = 0; i < n; i++)
        {
            int c = idx(s[i]);
            if (!ch[u][c])          //结点不存在
            {
                memset(ch[sz], 0, sizeof(ch[sz]));
                val[sz] = 0;        //中间结点的附加信息为0
                ch[u][c] = sz++;       //新建结点
            }
            u = ch[u][c];           //往下走
        }
        val[u] = v;                 //字符串的最后一个字符的附加信息为v
        ms[string(s)] = v;          //更新ms
    }
    //计算失配函数,方式和KMP很接近,只是将线性递归改成了按BFS顺序递推
    void getFail()
    {
        queue<int> q;
        f[0] = 0;
        //初始号队列
        for (int c = 0; c < SIGMA_SIZE; c++)
        {
            int u = ch[0][c];
            if (u)
            {
                f[u] = 0;
                q.push(u);
                last[u] = 0;
            }
        }
        //按BFS顺序计算失配函数
        while (!q.empty())
        {
            int r = q.front();
            q.pop();
            for (int c = 0; c < SIGMA_SIZE; c++)
            {
                int u = ch[r][c];
                if (!u) continue;
                q.push(u);
                int v = f[r];
                while (v && !ch[v][c]) v = f[v];
                f[u] = ch[v][c];
                last[u] = val[f[u]] ? f[u] : last[f[u]];
            }
        }
    }

    void Find(char* T)
    {
        int n = strlen(T);
        int j = 0;                  //当前结点编号,初始为根结点
        for (int i = 0; i < n; i++) //文本串当前指针
        {
            int c = idx(T[i]);
            while (j && !ch[j][c]) j = f[j];    //顺着失配边走,直到可以匹配
            j = ch[j][c];
            if (val[j]) print(j);
            else if (last[j]) print(last[j]);   //找到了
        }
    }

    void print(int j)
    {
        if (j)
        {
            cnt[val[j]]++;
            print(last[j]);
        }
    }
};

AhoCorasickAutomata ac;
char text[TEXT_SIZE], P[P_NUM][p_SIZE];
int n, T;

int main()
{
    while (~scanf("%d", &n), n)
    {
        ac.Init();                      //初始化
        for (int i = 1; i <= n; i++)
        {
            scanf("%s", P[i]);          //输入n个字符串(模板)
            ac.Insert(P[i], i);         //插入
        }

        ac.getFail();                   //失配函数
        scanf("%s", text);              //输入文本串
        ac.Find(text);                 //计算每个模板的 cnt 值
        int best = -1;
        for (int i = 1; i <= n; i++)
            if (ac.cnt[i] > best) best = ac.cnt[i]; //更新最大值

        printf("%d\n", best);
        for (int i = 1; i <= n; i++)
            if (ac.cnt[ms[string(P[i])]] == best) printf("%s\n", P[i]);
    }
    return 0;
}


你可能感兴趣的:(ACM,AC自动机)