题目链接:https://www.luogu.org/problem/P3966
题意:一篇论文是由许多个单词组成的,给出N个单词,查询每个单词在文章中出现的次数。
分析:其实还是裸的AC自动机。。。
构成文本串的时候直接在单词后面加一个特殊符号就行,查询函数遇到这个符号就重新从根开始,其他和上一篇一模一样。
insert,get_fail,topu函数都没有任何变化,因为我们插入的还是原本的单词,唯一有变化的只是文本串,所以只有用到文本串的查询函数变化了。
查询函数每次重头开始,就相当于所有模式串在按顺序来的一个个模式串里面匹配了。
#include<bits/stdc++.h>
using namespace std;
const int maxn=1e6+300;//单词间自行添加了符号,稍做扩大
const int inf=0x3f3f3f3f;
typedef long long ll;
#define meminf(a) memset(a,0x3f,sizeof(a))
#define mem0(a) memset(a,0,sizeof(a));
struct node{
int fail;//失配指针fail
int vis[26];//子节点的位置,也就是字典树的那26个字母
int end;//如果是尾节点就记录
int ans;//用来记录出现次数
}AC[200100];
char s[maxn];//用来输入模式串
char ss[maxn]; //用来输入文本串
int cnt=0;//Trie的指针
int in[maxn];//记录入度
int m[200100],Ans[200100];
void insert(char *s,int pos){
int len=strlen(s);
int now=0;//字典树的当前指针
for(int i=0;i<len;i++){
//Trie树没有这个子节点
if(AC[now].vis[s[i]-'a']==0) AC[now].vis[s[i]-'a']=++cnt;
//多组输入,需要清除 一个个清除,之前++cnt说明需要用到这个节点了
now=AC[now].vis[s[i]-'a'];
}
if(AC[now].end==0) AC[now].end=pos;//标记该结点是一个单词的结尾 ,并标记这是第几个单词
m[pos]=AC[now].end;//记录当前的单词的位置,可能是它本身,也可能是它重复单词里第一个出现的
}
void get_fail(){
queue<int> que;
for(int i=0;i<26;i++){//把第二层的fail指针都设为0
if(AC[0].vis[i]!=0)
{
AC[AC[0].vis[i]].fail=0;
que.push(AC[0].vis[i]);
in[0]++;
}
}
while(!que.empty())
{
int u=que.front();que.pop();
for(int i=0;i<26;i++){
if(AC[u].vis[i]!=0){
//如果当前结点的子节点存在,就将子节点的fail指针指向当前结点fail指针指向的结点的对应子节点处
AC[AC[u].vis[i]].fail=AC[AC[u].fail].vis[i];
in[AC[AC[u].fail].vis[i]]++;//被fail指针指向的结点的入度加1
que.push(AC[u].vis[i]);
}
else AC[u].vis[i]=AC[AC[u].fail].vis[i];
//否则直接将这个不存在的子节点指向当前结点fail指针指向结点的对应子节点处
}
}
}
void AC_query(char* s){
int len=strlen(s);
int now=0;
for(int i=0;i<len;i++){
if(s[i]=='T'){
now=0;continue;
}
now=AC[now].vis[s[i]-'a'];
AC[now].ans++;
}
}
void topu(){
queue<int> que;
for(int i=1;i<=cnt;i++)
if(in[i]==0) que.push(i);
while(!que.empty()){
int u=que.front();que.pop();
if(AC[u].end!=0) Ans[AC[u].end]=AC[u].ans;
int v=AC[u].fail;
if(v!=0) in[v]--,AC[v].ans+=AC[u].ans;
if(in[v]==0) que.push(v);
}
}
int main(){
int n;
scanf("%d",&n);
cnt=0;
for(int i=1;i<=n;i++){
scanf("%s",s);
insert(s,i);
strcat(ss,s);
strcat(ss,"T");
}
AC[0].fail=0;//结束标志
get_fail(); //求出失配指针
AC_query(ss);
topu();
for(int i=1;i<=n;i++){
printf("%d\n",Ans[m[i]]);
}
return 0;
}