• P3796 【模板】AC 自动机(加强版)


    题解 P3796 【【模板】AC自动机(加强版)】

    题目传送门
    https://www.luogu.com.cn/blog/juruohyfhaha/solution-p3796#

    先拿\(P3796\) 【模板】\(AC\)自动机(加强版)来说吧。

    无疑,作为模板2,这道题的解法也是十分的经典。

    我们先来分析一下题目:输入和模板1一样

    • 求出现次数最多的次数

    • 求出现次数最多的模式串

    明显,我们如果统计出每一个模式串在文本串出现的次数,那么这道题就变得十分简单了,那么问题就变成了如何统计每个模式串出现的次数。

    做法:AC自动机

    首先题目统计的是出现次数最多的字符串,所以有重复的字符串是没有关系的。(因为后面的会覆盖前面的,统计的答案也是一样的)

    那么我们就将标记模式串的\(flag\)设为当前是第几个模式串。就是下面插入时的变化:

    cnt[p]++;
    变为
    id[p] = x;//x表示该字符串是第x个输入的
    

    \(Fail\)指针没有变化,原先怎么求就怎么求。

    查询

    我们开一个数组\(cnt\),表示第\(i\)个字符串出现的次数。

    因为是重复计算,所以不能标记为\(-1\)了。

    我们每经过一个点,如果有模式串标记,就将\(cnt[\)模式串标记\(]++\)。然后继续跳\(fail\),原因上面说过了。

    这样我们就可以将每个模式串的出现次数统计出来。剩下的大家应该都会\(QwQ\)

    实现代码

    #include <bits/stdc++.h>
    using namespace std;
    const int N = 1e6 + 10; //文本串长度
    
    char s[160][80]; //多个模式串,一维是第几个模式串,二维是第i个模式串的每个字符
    char t[N];       //文本串t
    int tr[N][26], idx; // Trie树
    int id[N];          //通过节点号查字符串序号
    int n;
    int ne[N];
    int sum[N];
    
    //构建Trie树
    void insert(char *s, int x) {
        int p = 0;
        for (int i = 0; s[i]; i++) {
            int t = s[i] - 'a';
            if (!tr[p][t]) tr[p][t] = ++idx;
            p = tr[p][t];
        }
        id[p] = x;
    }
    int q[N];
    void bfs() {
        int hh = 0, tt = -1; //将队列的头和尾变量写在这里,可以有效防止多组测试数据的初始化问题
        for (int i = 0; i < 26; i++)
            if (tr[0][i]) q[++tt] = tr[0][i];
        while (hh <= tt) {
            int p = q[hh++];
            for (int i = 0; i < 26; i++) {
                int t = tr[p][i]; // p状态,通过i这条边,到达的新状态t; 也可以理解为是前缀
    
                if (!t)
                    tr[p][i] = tr[ne[p]][i]; //节点 指向父节点失配指针的i这条边
                else {
                    ne[t] = tr[ne[p]][i]; //失配指针指向父节点失配指针的i这条边
                    q[++tt] = t;          //存在的要入队列
                }
            }
        }
    }
    
    int main() {
        while (scanf("%d", &n) && n) {
            //多组测试数据
            memset(tr, false, sizeof tr);
            memset(id, false, sizeof id);
            memset(sum, false, sizeof sum);
            memset(ne, false, sizeof ne);
            idx = 0;
    
            for (int i = 1; i <= n; i++) {
                scanf("%s", s[i]);
                insert(s[i], i);
            }
            //构建失配指针
            bfs();
            //读入文本串
            scanf("%s", t);
            for (int i = 0, j = 0; t[i]; i++) {
                j = tr[j][t[i] - 'a'];
                for (int p = j; p; p = ne[p]) sum[id[p]]++;
            }
    
            for (int i = 1; i <= n; i++) Max = max(Max, sum[i]);
            printf("%d\n", Max);
    
            for (int i = 1; i <= n; i++)
                if (Max == sum[i]) printf("%s\n", s[i]);
        }
        return 0;
    }
    
  • 相关阅读:
    java得到当前日期的前一天或后一天
    java通过年月得到该月每一天的日期
    前后端分离的跨域请求问题解决
    关于java中分割字符串
    Linux终端命令
    eclipse中tomcat可以start启动,无法debug启动的解决
    通过DOS界面查看电脑上端口使用情况
    前端css
    mysql数据库
    IO阻塞
  • 原文地址:https://www.cnblogs.com/littlehb/p/16262551.html
Copyright © 2020-2023  润新知