AC自动机

AC自动机简介:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一。

用途:一个常见的例子就是给出n个单词,再给出一段包含m个字符的文章,让你找出有多少个单词在文章里出现过。

需要基础:要搞懂AC自动机,先得有模式树(字典树)TrieKMP模式匹配算法的基础知识。

复杂性分析:

对于 AC自动机来说时间复杂性为:O(L(T)+max(L(Pi))+m)气质m是模式串的数量。

对于 Trie 图 来说时间复杂性为:O(L(T))在此的时间复杂性都是指匹配的复杂度。

对于构造的代价是 O(sum(L(Pi)))其中sum是求和函数。

对于Trie的匹配来说时间复杂性为:O(max(L(Pi))L(T))其中L串的长度函数,P是模式串,T是目标串。

AC自动机算法分为3步:
1、构造一棵Trie
2、构造失败指针
3、模式匹配过程
代码模板:hdu2222

#include 
#include 
#include 
#include 
#include 
#define MAXN 500010
using namespace std;
struct Trie{
    int next[MAXN][26],fail[MAXN],end[MAXN];
    int root,L;
    int newnode(){
        for(int i=0;i<26;i++)
            next[L][i]=-1;
        end[L++]=0;
        return L-1;
    }
    void init(){
        L=0;
        root=newnode();
    }
    void insert(char buf[]){
        int len=strlen(buf);
        int now=root;
        for(int i=0;i Q;
        fail[root]=root;
        for(int i=0;i<26;i++){
            if(next[root][i]==-1)
                next[root][i]=root;
            else{
                fail[next[root][i]]=root;
                Q.push(next[root][i]);
            }
        }
        while(!Q.empty()){
            int now = Q.front();
            Q.pop();
            for(int i=0;i<26;i++){
                if(next[now][i]==-1)
                    next[now][i]=next[fail[now]][i];
                else{
                    fail[next[now][i]]=next[fail[now]][i];
                    Q.push(next[now][i]);
                }
            }
        }
    }
    int query(char buf[]){
        int len = strlen(buf);
        int now=root;
        int res=0;
        for(int i=0;i




你可能感兴趣的:(字符串)