BZOJ_3172_[Tjoi2013]单词_后缀自动机
Description
某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。
Input
第一个一个整数N,表示有多少个单词,接下来N行每行一个单词。每个单词由小写字母组成,N<=200,单词长度不超过10^6
Output
输出N个整数,第i行的数字表示第i个单词在文章中出现了多少次。
Sample Input
3
a
aa
aaa
a
aa
aaa
Sample Output
6
3
1
3
1
用AC自动机的话应该会比较好写吧。https://www.cnblogs.com/suika/p/9128027.html
这里尝试了下后缀自动机。相当于查询某个子串出现了多少次。
两种写法,建立广义后缀自动机或者中间用'{'分隔开。
我比较喜欢前者,好写且方便。
方法1:插入时标记每个串最后出现的节点位置,然后DP即可。
代码:
#include <cstdio> #include <string.h> #include <algorithm> using namespace std; #define N 1000050 int ch[N<<1][26],fa[N<<1],dep[N<<1],cnt=1,lst,n,flg[N]; int ws[N<<1],a[N<<1],siz[N<<1]; char w[N]; void insert(int x) { int p=lst,np,q,nq; if(ch[p][x]) { q=ch[p][x]; if(dep[q]==dep[p]+1) lst=q; else { fa[nq=++cnt]=fa[q]; lst=nq; dep[nq]=dep[p]+1; memcpy(ch[nq],ch[q],sizeof(ch[q])); fa[q]=nq; for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq; } }else { np=++cnt; lst=np; dep[np]=dep[p]+1; for(;p&&!ch[p][x];p=fa[p]) ch[p][x]=np; if(!p) fa[np]=1; else { q=ch[p][x]; if(dep[q]==dep[p]+1) fa[np]=q; else { fa[nq=++cnt]=fa[q]; dep[nq]=dep[p]+1; memcpy(ch[nq],ch[q],sizeof(ch[q])); fa[q]=fa[np]=nq; for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq; } } } } int main() { scanf("%d",&n); int i,j; for(i=1;i<=n;i++) { scanf("%s",w+1); lst=1; for(j=1;w[j];j++) insert(w[j]-'a'),siz[lst]++; flg[i]=lst; } for(i=1;i<=cnt;i++) ws[dep[i]]++; for(i=1;i<=cnt;i++) ws[i]+=ws[i-1]; for(i=cnt;i;i--) a[ws[dep[i]]--]=i; for(i=cnt;i;i--) { int p=a[i]; siz[fa[p]]+=siz[p]; } for(i=1;i<=n;i++) { printf("%d ",siz[flg[i]]); } }
方法2:注意每个串对应的结点不一定是一开始插入的那个结点。
需要每次找一遍,比较麻烦。
代码:
#include <cstdio> #include <string.h> #include <algorithm> using namespace std; #define N 2000050 int ch[N<<1][27],fa[N<<1],dep[N<<1],cnt=1,lst=1,n,flg[N]; int ws[N<<1],a[N<<1],siz[N<<1],l[233],r[233]; char w[N],s[N]; void insert(int x) { int p=lst,np=++cnt,q,nq; lst=np; dep[np]=dep[p]+1; for(;p&&!ch[p][x];p=fa[p]) ch[p][x]=np; if(!p) fa[np]=1; else { q=ch[p][x]; if(dep[q]==dep[p]+1) fa[np]=q; else { fa[nq=++cnt]=fa[q]; dep[nq]=dep[p]+1; memcpy(ch[nq],ch[q],sizeof(ch[q])); fa[q]=fa[np]=nq; for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq; } } } void print() { int i,j; printf("test------------------------------------------- "); for(i=1;i<=cnt;i++) { printf("p=%d,siz=%d,dep=%d,fa=%d ",i,siz[i],dep[i],fa[i]); for(j=0;j<=26;j++) { if(ch[i][j]) { printf("ch(%d)(%c)=%d ",i,j+'a',ch[i][j]); } } } printf("lst=%d ",lst); } int main() { scanf("%d",&n); int i,j,tot=0; for(i=1;i<=n;i++) { scanf("%s",w+1); l[i]=tot+1; for(j=1;w[j];j++) s[++tot]=w[j]-'a'; r[i]=tot; s[++tot]=26; } for(i=1;i<=tot;i++) insert(s[i]),siz[lst]++; // printf("%d ",flg[2]); // print(); for(i=1;i<=cnt;i++) ws[dep[i]]++; for(i=1;i<=cnt;i++) ws[i]+=ws[i-1]; for(i=1;i<=cnt;i++) a[ws[dep[i]]--]=i; for(i=cnt;i;i--) { int p=a[i]; siz[fa[p]]+=siz[p]; } for(i=1;i<=n;i++) { int p=1; // printf("%d %d ",l[i],r[i]); for(j=l[i];j<=r[i];j++) p=ch[p][s[j]]; // printf("p=%d ",p); printf("%d ",siz[p]); } }
方法