• 后缀自动机求字典序第k小的串——p3975


    又领悟到了一点新的东西,后缀自动机其实可以分为两个数据结构,一个是后缀树,还有一个是自动机

    后缀树用来划分endpos集合,并且维护后缀之间的关系,此时每个结点代表的是一些后缀相同且长度连续的子串

    自动机用来处理边的转移,或者用来解决串的匹配问题,此时每个结点代表的只是一个串,这个串等于从root开始到这结点经过的路径,由于路径可能有很多条,所以对应到后缀树上,就是有一段连续的串啦

    字典序第k小的串刚好可以用SAM的性质解决

    /*
    题目要求考虑两种情况:
    首先来考虑算重复子串的情况
        处理后缀树:先求出每个状态endpos的大小(即这个状态代表的所有串出现的次数)size[i](endpos的大小即该状态的后缀子树的大小,所有的前缀结点贡献为1,克隆结点大小为0)
        处理自动机:自底向上求出从每个状态出发能形成的子串个数 sum[i]+=sum{sum[j]} ,初始有sum[i]=size[i](即从这种状态开始有多少不同的子串,当然这种状态本身的方案数也算) 
        最后以root为起点,在自动机上进行搜索即可,具体搜索方式类似于多叉树(DAG)查询 
    然后来考虑不算重复子串的情况
        处理后缀树:求endpos的大小 
        处理自动机:自底向上求每个状态出发能形成的子串个数sum[i]=sum{sum[j]} 初始有sum[i]=1,即这个状态的每个串认为只出现一次 
                    再换一种思路:其实只要维护处每个状态作为起点的不同路径数即可 
        搜索过程不变
    */
    #include<bits/stdc++.h>
    using namespace std;
    #define maxn 500005
    long long T,K;
    char s[maxn];
    struct SAM{
        int last,cnt;
        int nxt[maxn<<1][26];
        int len[maxn<<1];
        int link[maxn<<1];
        int size[maxn<<1];
        long long sum[maxn<<1];//sum[i]表示从状态i开始的子串总数 
        SAM(){
            last=cnt=1;
        }
        void add(int c){
            int p=last,np=last=++cnt;
            len[np]=len[p]+1;
            size[np]=1;
            for(;p&&!nxt[p][c];p=link[p])
                nxt[p][c]=np;
            if(!p){link[np]=1;return;}
            
            int q=nxt[p][c];
            if(len[q]==len[p]+1){link[np]=q;return;}
            
            int clone=++cnt;
            link[clone]=link[q];
            len[clone]=len[p]+1;
            memcpy(nxt[clone],nxt[q],sizeof nxt[q]);
            link[q]=link[np]=clone;
            for(;p&&nxt[p][c]==q;p=link[p])
                nxt[p][c]=clone;
        }
        int id[maxn<<1],t[maxn<<1];
        void sort(){
            for(int i=1;i<=cnt;i++)t[len[i]]++;
            for(int i=1;i<=cnt;i++)t[i]+=t[i-1];
            for(int i=1;i<=cnt;i++)id[t[len[i]]--]=i;
        }
        void work(){//求子串的总数 
            //处理后缀树上的endpos 
            for(int i=cnt;i>=1;i--)
                size[link[id[i]]]+=size[id[i]];
            for(int i=1;i<=cnt;i++)
                if(T==0)sum[i]=size[i]=1;//要求去重,每个状态代表的串只统计一次 
                else sum[i]=size[i];
            size[1]=sum[1]=0;
            //自底向上处理自动机 
            for(int i=cnt;i>=1;i--)
                for(int j=0;j<26;j++)
                    if(nxt[id[i]][j])
                        sum[id[i]]+=sum[nxt[id[i]][j]]; 
        }
    }p;
    
    void print(long long now,long long k){
        if(k<=p.size[now])return;//如果这个结点代表的串也不能走完,返回 
        k-=p.size[now];
        for(int i=0;i<26;i++){
            int tmp=p.nxt[now][i];
            if(!tmp)continue;
            if(k>p.sum[tmp]){
                k-=p.sum[tmp];
                continue; 
            } 
            
            putchar(i+'a');//沿着这个状态往下搜 
            print(tmp,k);
            return;
        } 
    } 
    
    int main(){
        scanf("%s%lld%lld",s,&T,&K);
        int len=strlen(s);
        for(int i=0;i<len;i++)
            p.add(s[i]-'a');
    
        p.sort();
    
        p.work();
        
        if(p.sum[1]<K)printf("-1");
        else print(1,K);
        puts("");
        
    }
  • 相关阅读:
    CentOS 7 安装MySQL 5.7
    Introduction to BGP (4)
    Introduction to BGP (3)
    Introduction to BGP (2)
    Introduction to BGP (1)
    Cisco NAT Fundation
    Linux安装Nginx
    GRE协议学习与练习
    Oracle Study Note : Users and Basic Security
    Oracle Study Note : Tablespace and Data Files
  • 原文地址:https://www.cnblogs.com/zsben991126/p/11313679.html
Copyright © 2020-2023  润新知