• Codeforces Round #244 (Div. 2)D (后缀自己主动机)


    Codeforces Round #244 (Div. 2)D (后缀自己主动机)

    (标号为0的节点一定是null节点,不管怎样都不能拿来用,切记切记,以后不能再错了)

    这题用后缀自己主动机的话,对后缀自己主动机的非常多性质有足够深刻的理解。

    没想过后缀数组怎么做。由于不高兴敲。。。

    题意:给出两个长度均不超过5000的字符串s1,s2,求这两个串中,都仅仅出现一次的最短公共子串。

    解题思路:求的是公共子串,然后对出现的次数又有限制,第一想法就是后缀自己主动机啊,后缀自己主动机处理子串出现次数再合适只是了。做法是这种。先建立s1的sam。用拓扑dp,求出每一个节点的代表串出现的次数。

    目的是什么呢?事实上我是想求ok[i][j]。表示s1[i] ~ s1[j]的这个子串是否仅仅出现了一次。

    如今我们求出了代表串的出现次数了。怎么求这个ok[i][j]呢?拿s1在建立好的自己主动机上匹配,当前匹配到了s1[i],记录temp表示当前匹配的最长长度。now表示当前匹配在哪个节点。这里有一个跟AC自己主动机非常相似的性质。匹配到了now,则一定能匹配fa[now]。

    那么就顺着now往上走。一直找到第一个出现次数大于1的节点p,那么以i为结尾。长度为val[p]+1到temp的子串在s1里面肯定都仅仅出现一次了。把这个记录到ok数组里。    第二步是对s2处理了。还是一样的过程,建立sam。求出每一个点的代表串出现的次数,即cnt[]数组。   第三步就要拿s1在s2的sam上进行匹配了,匹配过程类似于前面处理s1的ok数组,找出当前匹配的最长长度temp。匹配到的节点now,顺着now往上。找到第一个cnt大于1的节点p。在s2里面,以当前匹配上的子串的结尾为结尾的长度为val[p] + 1到temp的子,串必定仅仅在s2里出现过一次。

    然后就枚举j,从val[p] + 1到temp,假设在s1里面。以i为结尾。长度为j的子串仅仅出现1次(即ok[i-j+1][i] == 1)。那么这个j就有可能成为答案,用其更新ans就可以。

    代码:

    #include<stdio.h>
    #include<string.h>
    #include<algorithm>
    using namespace std ;
    
    const int maxn = 5001 ;
    bool ok[maxn][maxn] ;
    int ans = 111111 ;
    
    struct SAM  {
        int fa[maxn<<1] , val[maxn<<1] , c[26][maxn<<1] ;
        int cnt[maxn<<1] ; int tot , last ;
        int ws[maxn<<1] , wv[maxn<<1] ;
    
        inline int new_node ( int _val ) {
            val[++tot] = _val ;
            for ( int i = 0 ; i < 26 ; i ++ ) c[i][tot] = 0 ;
            cnt[tot] = fa[tot] = 0 ;
            return tot ;
        }
    
        void add ( int k ) {
            int p = last , i ;
            int np = new_node ( val[p] + 1 ) ;
            while ( p && !c[k][p] ) c[k][p] = np , p = fa[p] ;
            if ( !p ) fa[np] = 1 ;
            else {
                int q = c[k][p] ;
                if ( val[q] == val[p] + 1 ) fa[np] = q ;
                else {
                    int nq = new_node ( val[p] + 1 ) ;
                    for ( i = 0 ; i < 26 ; i ++ )
                        c[i][nq] = c[i][q] ;
                    fa[nq] = fa[q] ;
                    fa[q] = fa[np] = nq ;
                    while ( p && c[k][p] == q ) c[k][p] = nq , p = fa[p] ;
                }
            }
            last = np ;
        }
    
        void init () {
            tot = 0 ;
            last = new_node ( 0 ) ;
        }
    
        void SORT () {
            for ( int i = 0 ; i < maxn ; i ++ ) wv[i] = 0 ;
            for ( int i = 1 ; i <= tot ; i ++ ) wv[val[i]] ++ ;
            for ( int i = 1 ; i < maxn ; i ++ ) wv[i] += wv[i-1] ;
            for ( int i = 1 ; i <= tot ; i ++ ) ws[wv[val[i]]--] = i ;
        }
    
        void get_cnt ( char *s , int n ) {
            SORT () ;
            int now = 1 , i ;
            memset ( cnt , 0 , sizeof ( cnt ) ) ;
            for ( i = 1 ; i <= n ; i ++ ) {
                int k = s[i] - 'a' ;
                now = c[k][now] ;
                cnt[now] ++ ;
            }
            for ( i = tot ; i >= 1 ; i -- ) {
                now = ws[i] ;
                cnt[fa[now]] += cnt[now] ;
            }
        }
    
        void gao ( char *s , int n ) {
            get_cnt ( s , n ) ;
            int now = 1 , i , j ;
            for ( i = 1 ; i <= n ; i ++ ) {
                int k = s[i] - 'a' ;
                now = c[k][now] ;
                int p = now ;
                while ( fa[p] && cnt[p] == 1 ) p = fa[p] ;
                for ( j = 1 ; j <= i - val[p] ; j ++ )
                    ok[j][i] = 1 ;
            }
        }
    
        void work ( char *s , int n ) {
            int temp = 0 , now = 1 , i , j ;
            for ( i = 1 ; i <= n ; i ++ ) {
                int k = s[i] - 'a' ;
                if ( c[k][now] ) {
                    temp ++ ; now = c[k][now] ;
                    int p = now ;
                    while ( fa[p] && cnt[p] == 1 ) p = fa[p] ;
                    for ( j = val[p] + 1 ; j <= temp ; j ++ )
                        if ( ok[i-j+1][i] ) {
                            ans = min ( ans , j ) ;
                            break ;
                        }
                }
                else {
                    while ( now && !c[k][now] ) now = fa[now] ;
                    if ( !now ) now = 1 , temp = 0 ;
                    else {
                        temp = val[now] + 1 ;
                        now = c[k][now] ;
                        int p = now ;
                        while ( fa[p] && cnt[p] == 1 ) p = fa[p] ;
                        for ( j = val[p] + 1 ; j <= temp ; j ++ )
                            if ( ok[i-j+1][i] ) {
                                ans = min ( ans , j ) ;
                                break ;
                            }
                    }
                }
            }
        }
    
    } ac ;
    char s1[maxn] , s2[maxn] ;
    
    int main () {
        scanf ( "%s" , s1 + 1 ) ;
        ac.init () ;
        int n = strlen ( s1 + 1 ) , i , j ;
        for ( i = 1 ; i <= n ; i ++ )
            ac.add ( s1[i] - 'a' ) ;
        ac.gao ( s1 , n ) ;
        scanf ( "%s" , s2 + 1 ) ;
        ac.init () ;
        int m= strlen ( s2 + 1 ) ;
        for ( i = 1 ; i <= m ; i ++ )
            ac.add ( s2[i] - 'a' ) ;
        ac.get_cnt ( s2 , m ) ;
        ac.work ( s1 , n ) ;
        if ( ans == 111111 ) puts ( "-1" ) ;
        else printf ( "%d
    " , ans ) ;
        return 0 ;
    }
    


  • 相关阅读:
    数据结构化与保存
    使用正则表达式,取得点击次数,函数抽离
    爬取校园新闻首页的新闻
    网络爬虫基础练习
    词频统计
    试题----编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串。 但是要保证汉字不被截半个
    试题---求出现重现次数最多的字母,如有多个重复的则都求出来
    试题----为什么Java的string类要设成immutable(不可变的)
    面试题---题目
    复制文件夹中所有内容到指定位置
  • 原文地址:https://www.cnblogs.com/yangykaifa/p/6940287.html
Copyright © 2020-2023  润新知