• Gym


    Mr. Panda and Fantastic Beasts

    题意

    给出若干个字符串,找到一个最短的字典序最小的字符串且仅是第一个字符串的子串。

    分析

    对于这种多个字符串、重复的子串问题一般都要连接字符串加后缀数组解决(当然也存在其它方法)。
    用一个未出现的字符连接多个字符串,计算出后缀数组,枚举 (sa) 数组((sa) 数组是按字典序排序的,保证我们选到的相同长度的子串一定是字典序最小的)。
    如果枚举到的 (sa) 的首字母都属于第一个字符串,那么全部存起来,直到遇到其它字符串,我们用前面存起来的的值分别与前面最近的、后面最近的首字母不在第一个字符串的后缀串计算 (LCP1, LCP2) (这个可以用 (ST) 算法预处理),那么长度至少为是 (max{LCP1, LCP2} + 1),但是必须保证加上首字母的下标不超过第一个字符串的长度。

    code

    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    #include<iostream>
    #include<cmath>
    typedef long long ll;
    using namespace std;
    const int MAXN = 5e5 + 10;
    const int INF = 1e8;
    char s[MAXN];
    int sa[MAXN], t[MAXN], t2[MAXN], c[MAXN], n; // n 为 字符串长度 + 1,即最后一位为数字 0
    int rnk[MAXN], height[MAXN];
    // 构造字符串 s 的后缀数组。每个字符值必须为 0 ~ m-1
    void build_sa(int m) {
        int i, *x = t, *y = t2;
        for(i = 0; i < m; i++) c[i] = 0;
        for(i = 0; i < n; i++) c[x[i] = s[i]]++;
        for(i = 1; i < m; i++) c[i] += c[i - 1];
        for(i = n - 1; i >= 0; i--) sa[--c[x[i]]] = i;
        for(int k = 1; k <= n; k <<= 1) {
            int p = 0;
            for(i = n - k; i < n; i++) y[p++] = i;
            for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i] - k;
            for(i = 0; i < m; i++) c[i] = 0;
            for(i = 0; i < n; i++) c[x[y[i]]]++;
            for(i = 0; i < m; i++) c[i] += c[i - 1];
            for(i = n - 1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];
            swap(x, y);
            p = 1; x[sa[0]] = 0;
            for(i = 1; i < n; i++)
                x[sa[i]] = y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + k] == y[sa[i] + k] ? p - 1 : p++;
            if(p >= n) break;
            m = p;
        }
    }
    void getHeight() {
        int i, j, k = 0;
        for(i = 0; i < n; i++) rnk[sa[i]] = i;
        for(i = 0; i < n - 1; i++) {
            if(k) k--;
            j = sa[rnk[i] - 1];
            while(s[i + k] == s[j + k]) k++;
            height[rnk[i]] = k;
        }
    }
    int T, kase = 1;
    char s2[MAXN];
    int q[MAXN];
    int dp[MAXN][30];
    void init() {
        for(int i = 0; i < n; i++) {
            dp[i][0] = height[i];
        }
        for(int i = 1; (1 << i) < MAXN; i++) {
            for(int j = 0; j < n; j++) {
                dp[j][i] = min(dp[j][i - 1], dp[j + (1 << (i - 1))][i - 1]);
            }
        }
    }
    int query(int l, int r) {
        if(l > r) swap(l, r);
        l++;
        int k = (int)(log((double)r - l + 1) / log(2.0));
        return min(dp[l][k], dp[r - (1 << k) + 1][k]);
    }
    int main() {
        scanf("%d", &T);
        while(T--) {
            int m;
            scanf("%d", &m);
            scanf("%s", s);
            int L = strlen(s);
            int k = L;
            s[L++] = '$';
            for(int i = 1; i < m; i++) {
                scanf("%s", s2);
                int l = strlen(s2);
                for(int j = L; j < L + l; j++) {
                    s[j] = s2[j - L];
                }
                L += l;
                s[L++] = '$';
            }
            s[L] = 0;
            n = L + 1;
            build_sa(128);
            getHeight();
            init();
            int p = -1, len = 0, cnt = 0, pre = -1;
            if(sa[1] < k) q[cnt++] = sa[1];
            else pre = sa[1];
            for(int i = 2; i < n; i++) {
                while(i < n && sa[i] < k) {
                    q[cnt++] = sa[i];
                    i++;
                }
                if(i == n) break;
                for(int j = 0; j < cnt; j++) {
                    int tmp1;
                    if((tmp1 = query(rnk[q[j]], rnk[sa[i]])) + q[j] < k) {
                        int tmp2;
                        if(pre != -1 && (tmp2 = query(rnk[q[j]], rnk[pre])) + q[j] < k) {
                            int tlen = max(tmp1, tmp2) + 1;
                            if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
                                p = q[j];
                                len = tlen;
                            }
                        }
                        if(pre == -1) {
                            int tlen = tmp1 + 1;
                            if((q[j] + tlen <= k) && (p == -1 || tlen < len)) {
                                p = q[j];
                                len = tlen;
                            }
                        }
                    }
                }
                cnt = 0;
                if(sa[i] >= k) pre = sa[i];
            }
            for(int i = 0; i < cnt; i++) {
                int tmp1;
                if(pre != -1 && (tmp1 = query(rnk[q[i]], rnk[pre])) + q[i] < k) {
                    int tlen = tmp1 + 1;
                    if((q[i] + tlen <= k) && (p == -1 || tlen < len)) {
                        p = q[i];
                        len = tlen;
                    }
                }
            }
            printf("Case #%d: ", kase++);
            if(p == -1) puts("Impossible");
            else {
                for(int i = p; i < p + len; i++) printf("%c", s[i]);
                printf("
    ");
            }
        }
        return 0;
    }
    
  • 相关阅读:
    爬虫 效率
    Scrapy 数据存储 图片和文件
    装饰器
    Django 项目部署测试
    Django 项目部署
    Django JS
    三十九、管理信息系统 第三部分 作业
    三十八、模型分离(选做)
    三十七、密码保护
    三十六、实现搜索功能
  • 原文地址:https://www.cnblogs.com/ftae/p/7253101.html
Copyright © 2020-2023  润新知