3172: [Tjoi2013]单词
Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 4293 Solved: 2083
[Submit][Status][Discuss]
Description
某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。
Input
第一个一个整数N,表示有多少个单词,接下来N行每行一个单词。每个单词由小写字母组成,N<=200,单词长度不超过10^6
Output
输出N个整数,第i行的数字表示第i个单词在文章中出现了多少次。
Sample Input
3
a
aa
aaa
a
aa
aaa
Sample Output
6
3
1
3
1
第一次遇到这道题的时候,才疏学浅的我用裸的AC自动机竟然A了。。就没有多想什么
后来遇到了阿狸的打字机,听说这题的正解是fail树,于是回来练练手
首先数据很水AC自动机可以直接过
再来正解就是fail树,就是拿fail构造的树
在整个fail图中存在多少u节点所对应的字符串,在fail树中以u为根的子树就有多大
注意:
建立fail指针时,应先将fail[0]置为一个不会用到的值,否则就会遇到根0指向的单词的fail指向自己的情况,普通AC自动机的构建也应加上这个操作
#include<iostream> #include<cstdio> #include<cstring> #include<algorithm> #define LL long long int #define REP(i,n) for (int i = 1; i <= (n); i++) #define fo(i,x,y) for (int i = (x); i <= (y); i++) #define Redge(u) for (int k = head[u]; k != -1; k = edge[k].next) using namespace std; const int maxn = 1000005,maxm = 205,INF = 1000000000; //begin 18:51 End 19:04 char P[maxn]; int ch[maxn][26],fail[maxn],sum[maxn],siz = 0,n,q[maxn],head,tail,E[maxm]; void insert(int p){ int u = 0,len = strlen(P),id; for (int i = 0; i <len; i++){ id = P[i] - 'a'; ++sum[u = ch[u][id] ? ch[u][id] : ch[u][id] = ++siz]; } E[p] = u; } void getf(){ head = 0; tail = 1; fail[0] = -1; int u,v; while (head < tail){ u = q[++head]; for (int i = 0 ; i < 26; i++){ v = ch[u][i]; if (!v) ch[u][i] = ch[fail[u]][i]; else q[++tail] = v,fail[v] = ch[fail[u]][i]; } } } int main() { cin>>n; REP(i,n) scanf("%s",P),insert(i); getf(); for (int i = tail; i; i--) sum[fail[q[i]]] += sum[q[i]]; REP(i,n) printf("%d ",sum[E[i]]); return 0; }