AC自动机总结

假装没事ソ 提交于 2019-12-01 07:13:54

问题引入

考虑KMP问题的升级版,即有多个模式串,单个文本串。问匹配次数。

问题解决

暴力KMP

考虑对于每一个模式串建一个\(fail\)然后对于每一个模式串都和文本串暴力跑。

AC自动机

前置知识

Trie树,bfs……没什么好说的。

算法实现

我们考虑将所有的模式串放到一颗\(Trie\)树,如果匹配失败的话转移到\(fail\)指针上面去,这样子复杂度就是\(O(n)\)的了 。

唯一的问题在于\(fail\)怎么构建,直接$BFS即可。

代码实现

void insert(char *s){
    int l=strlen(s),pos=0;
    for(int i=0;i<l;i++){
        int x=s[i]-'a';
        if(!ch[pos][x])ch[pos][x]=++tot;
        pos=ch[pos][x];
    }
    siz[pos]++;
}
queue<int>Q;
void get_fail(){
    for(int i=0;i<26;i++)
        if(ch[0][i]){
            Q.push(ch[0][i]);fail[ch[0][i]]=0;
        }
    while(!Q.empty()){
        int u=Q.front();Q.pop();
        for(int i=0;i<26;i++){
            int &v=ch[u][i];
            if(v){
                fail[v]=ch[fail[u]][i];Q.push(v);
            }
            else v=ch[fail[u]][i];
        }
    }
}
int query(char *s){
    int l=strlen(s),pos=0,ans=0;
    for(int i=0;i<l;i++){
        int x=s[i]-'a';pos=ch[pos][x];
        for(int u=pos;u &&~siz[u];u=fail[u]){
            ans+=siz[u];siz[u]=-1;
        }
    }
    return ans;
}
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!