• BZOJ_3172_[Tjoi2013]单词_后缀自动机


    BZOJ_3172_[Tjoi2013]单词_后缀自动机

    Description

    某人读论文,一篇论文是由许多单词组成。但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次。

    Input

    第一个一个整数N,表示有多少个单词,接下来N行每行一个单词。每个单词由小写字母组成,N<=200,单词长度不超过10^6

    Output

    输出N个整数,第i行的数字表示第i个单词在文章中出现了多少次。

    Sample Input

    3
    a
    aa
    aaa

    Sample Output

    6
    3
    1

    用AC自动机的话应该会比较好写吧。https://www.cnblogs.com/suika/p/9128027.html
    这里尝试了下后缀自动机。相当于查询某个子串出现了多少次。
    两种写法,建立广义后缀自动机或者中间用'{'分隔开。
    我比较喜欢前者,好写且方便。
    方法1:插入时标记每个串最后出现的节点位置,然后DP即可。
    代码:
    #include <cstdio>
    #include <string.h>
    #include <algorithm>
    using namespace std;
    #define N 1000050
    int ch[N<<1][26],fa[N<<1],dep[N<<1],cnt=1,lst,n,flg[N];
    int ws[N<<1],a[N<<1],siz[N<<1];
    char w[N];
    void insert(int x) {
        int p=lst,np,q,nq;
        if(ch[p][x]) {
            q=ch[p][x];
            if(dep[q]==dep[p]+1) lst=q;
            else {
                fa[nq=++cnt]=fa[q]; lst=nq;
                dep[nq]=dep[p]+1;
                memcpy(ch[nq],ch[q],sizeof(ch[q]));
                fa[q]=nq;
                for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
            }
        }else {
            np=++cnt; lst=np; dep[np]=dep[p]+1;
            for(;p&&!ch[p][x];p=fa[p]) ch[p][x]=np;
            if(!p) fa[np]=1;
            else {
                q=ch[p][x];
                if(dep[q]==dep[p]+1) fa[np]=q;
                else {
                    fa[nq=++cnt]=fa[q];
                    dep[nq]=dep[p]+1;
                    memcpy(ch[nq],ch[q],sizeof(ch[q]));
                    fa[q]=fa[np]=nq;
                    for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
                }
            }
        }
    }
    int main() {
        scanf("%d",&n);
        int i,j;
        for(i=1;i<=n;i++) {
            scanf("%s",w+1);
            lst=1;
            for(j=1;w[j];j++) insert(w[j]-'a'),siz[lst]++;
            flg[i]=lst;
        }
        for(i=1;i<=cnt;i++) ws[dep[i]]++;
        for(i=1;i<=cnt;i++) ws[i]+=ws[i-1];
        for(i=cnt;i;i--) a[ws[dep[i]]--]=i;
        for(i=cnt;i;i--) {
            int p=a[i];
            siz[fa[p]]+=siz[p];
        }
        for(i=1;i<=n;i++) {
            printf("%d
    ",siz[flg[i]]);
        }
    }
    

     方法2:注意每个串对应的结点不一定是一开始插入的那个结点。

    需要每次找一遍,比较麻烦。

    代码:

    #include <cstdio>
    #include <string.h>
    #include <algorithm>
    using namespace std;
    #define N 2000050
    int ch[N<<1][27],fa[N<<1],dep[N<<1],cnt=1,lst=1,n,flg[N];
    int ws[N<<1],a[N<<1],siz[N<<1],l[233],r[233];
    char w[N],s[N];
    void insert(int x) {
        int p=lst,np=++cnt,q,nq;
        lst=np; dep[np]=dep[p]+1;
        for(;p&&!ch[p][x];p=fa[p]) ch[p][x]=np;
        if(!p) fa[np]=1;
        else {
            q=ch[p][x];
            if(dep[q]==dep[p]+1) fa[np]=q;
            else {
                fa[nq=++cnt]=fa[q];
                dep[nq]=dep[p]+1;
                memcpy(ch[nq],ch[q],sizeof(ch[q]));
                fa[q]=fa[np]=nq;
                for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
            }
        }
    }
    void print() {
        int i,j;
        printf("test-------------------------------------------
    ");
        for(i=1;i<=cnt;i++) {
            printf("p=%d,siz=%d,dep=%d,fa=%d
    ",i,siz[i],dep[i],fa[i]);
            for(j=0;j<=26;j++) {
                if(ch[i][j]) {
                    printf("ch(%d)(%c)=%d
    ",i,j+'a',ch[i][j]);
                }
            }
        }
        printf("lst=%d
    ",lst);
    }
    int main() {
        scanf("%d",&n);
        int i,j,tot=0;
        for(i=1;i<=n;i++) {
            scanf("%s",w+1);
            l[i]=tot+1;
            for(j=1;w[j];j++) s[++tot]=w[j]-'a';
            r[i]=tot;
            s[++tot]=26;
        }
        for(i=1;i<=tot;i++) insert(s[i]),siz[lst]++;
        // printf("%d
    ",flg[2]);
        // print();
        for(i=1;i<=cnt;i++) ws[dep[i]]++;
        for(i=1;i<=cnt;i++) ws[i]+=ws[i-1];
        for(i=1;i<=cnt;i++) a[ws[dep[i]]--]=i;
        for(i=cnt;i;i--) {
            int p=a[i];
            siz[fa[p]]+=siz[p];
        }
        for(i=1;i<=n;i++) {
            int p=1;
            // printf("%d %d
    ",l[i],r[i]);
            for(j=l[i];j<=r[i];j++) p=ch[p][s[j]];
            // printf("p=%d
    ",p);
            printf("%d
    ",siz[p]);
        }
    }
    
    方法
  • 相关阅读:
    pandas 长宽格式的转换——pivot、pivot_table和melt
    PowerBI开发 第21篇:关键因素(Key Influencer)
    pandas Series矢量化的字符串函数——Series.str
    前端面试
    WebService详细讲解
    redis哨兵模式和集群模式优缺点_redis集群哨兵模式
    HTTPS如何保证数据传输安全性
    oracle 序列简介
    dataguard基本简介及三大保护模式介绍
    一致性哈希算法原理详解
  • 原文地址:https://www.cnblogs.com/suika/p/9153046.html
Copyright © 2020-2023  润新知