AC自动机 fail树优化

AC自动机优化学习笔记


fail 树

  • 由于每个点都只连出一条 fail 边,且连到的点对应的字符串长度更小,所以 fail 边构成了一棵 fail 树
  • 关于某个模式串的接受状态,也就是与某个模式串匹配(以某个模式串为后缀)的那些状态,就是那个串在 Trie 树上的终止节点在 fail 树上的子树
  • 建出 fail 树,记录自动机上的每个状态被匹配了几次,最后求出每个模式串在 Trie 上的终止节点在 fail 树上的子树总匹配次数就可以

代码

void AddEdge(int u, int v) {	//存fail边
		edge[++tot].v = v;
		edge[tot].next = head[u];
		head[u] = tot;
	}
	void dfs(int now) {	//递归计算子树
		for (int i = head[now]; i; i = edge[i].next) {
			dfs(edge[i].v);
			size[now] += size[edge[i].v];
		}
	}
	void rebuild() {	//建树
		for (int i = 1; i <= num; i++) AddEdge(fail[i], i);
		dfs(root);
	}
	void find(char* str, int n) {
		register int position = root;
		for (int i = 0; str[i]; i++)
			position = tree[position][str[i] - 'a'],
			size[position]++;
		rebuild();		//建树统计
		for (int i = 1; i <= n; i++)
			printf("%d\n", size[mark[i]]);
	}

学习资料

AC自动机学习笔记

你可能感兴趣的:(字符串)