点击打开题目链接
AC自动机,需要对 Trie 和 KMP 有一定的了解。
#include <cstdio> #include <cstring> #include <map> #include <queue> #include <iostream> using namespace std; const int TEXT_SIZE = 1000000 + 10; const int SIGMA_SIZE = 26; const int P_NUM = 150 + 10; const int p_SIZE = 70 + 10; const int MAXNODE = 20000; map<string, int> ms; struct AhoCorasickAutomata { int sz; //结点总数 int cnt[P_NUM]; int f[MAXNODE], last[MAXNODE], ch[MAXNODE][SIGMA_SIZE]; int val[MAXNODE]; int idx(char c) //字符 c 的编号 { return c - 'a'; } void Init() //初始化 { sz = 1; memset(ch[0], 0, sizeof(ch[0])); memset(cnt, 0, sizeof(cnt)); ms.clear(); } //插入字符串 s,附件信息为 v。注意 v 必须非0,因为0代表“本结点不是单词结点” void Insert(char* s, int v) { int u = 0, n = strlen(s); for (int i = 0; i < n; i++) { int c = idx(s[i]); if (!ch[u][c]) //结点不存在 { memset(ch[sz], 0, sizeof(ch[sz])); val[sz] = 0; //中间结点的附加信息为0 ch[u][c] = sz++; //新建结点 } u = ch[u][c]; //往下走 } val[u] = v; //字符串的最后一个字符的附加信息为v ms[string(s)] = v; //更新ms } //计算失配函数,方式和KMP很接近,只是将线性递归改成了按BFS顺序递推 void getFail() { queue<int> q; f[0] = 0; //初始号队列 for (int c = 0; c < SIGMA_SIZE; c++) { int u = ch[0][c]; if (u) { f[u] = 0; q.push(u); last[u] = 0; } } //按BFS顺序计算失配函数 while (!q.empty()) { int r = q.front(); q.pop(); for (int c = 0; c < SIGMA_SIZE; c++) { int u = ch[r][c]; if (!u) continue; q.push(u); int v = f[r]; while (v && !ch[v][c]) v = f[v]; f[u] = ch[v][c]; last[u] = val[f[u]] ? f[u] : last[f[u]]; } } } void Find(char* T) { int n = strlen(T); int j = 0; //当前结点编号,初始为根结点 for (int i = 0; i < n; i++) //文本串当前指针 { int c = idx(T[i]); while (j && !ch[j][c]) j = f[j]; //顺着失配边走,直到可以匹配 j = ch[j][c]; if (val[j]) print(j); else if (last[j]) print(last[j]); //找到了 } } void print(int j) { if (j) { cnt[val[j]]++; print(last[j]); } } }; AhoCorasickAutomata ac; char text[TEXT_SIZE], P[P_NUM][p_SIZE]; int n, T; int main() { while (~scanf("%d", &n), n) { ac.Init(); //初始化 for (int i = 1; i <= n; i++) { scanf("%s", P[i]); //输入n个字符串(模板) ac.Insert(P[i], i); //插入 } ac.getFail(); //失配函数 scanf("%s", text); //输入文本串 ac.Find(text); //计算每个模板的 cnt 值 int best = -1; for (int i = 1; i <= n; i++) if (ac.cnt[i] > best) best = ac.cnt[i]; //更新最大值 printf("%d\n", best); for (int i = 1; i <= n; i++) if (ac.cnt[ms[string(P[i])]] == best) printf("%s\n", P[i]); } return 0; }