题解 P3796 【【模板】AC自动机(加强版)】
题目传送门
https://www.luogu.com.cn/blog/juruohyfhaha/solution-p3796#
先拿\(P3796\) 【模板】\(AC\)自动机(加强版)来说吧。
无疑,作为模板2,这道题的解法也是十分的经典。
我们先来分析一下题目:输入和模板1一样
-
求出现次数最多的次数
-
求出现次数最多的模式串
明显,我们如果统计出每一个模式串在文本串出现的次数,那么这道题就变得十分简单了,那么问题就变成了如何统计每个模式串出现的次数。
做法:AC自动机
首先题目统计的是出现次数最多的字符串,所以有重复的字符串是没有关系的。(因为后面的会覆盖前面的,统计的答案也是一样的)
那么我们就将标记模式串的\(flag\)设为当前是第几个模式串。就是下面插入时的变化:
cnt[p]++;
变为
id[p] = x;//x表示该字符串是第x个输入的
求\(Fail\)指针没有变化,原先怎么求就怎么求。
查询
我们开一个数组\(cnt\),表示第\(i\)个字符串出现的次数。
因为是重复计算,所以不能标记为\(-1\)了。
我们每经过一个点,如果有模式串标记,就将\(cnt[\)模式串标记\(]++\)。然后继续跳\(fail\),原因上面说过了。
这样我们就可以将每个模式串的出现次数统计出来。剩下的大家应该都会\(QwQ\)!
实现代码
#include <bits/stdc++.h>
using namespace std;
const int N = 1e6 + 10; //文本串长度
char s[160][80]; //多个模式串,一维是第几个模式串,二维是第i个模式串的每个字符
char t[N]; //文本串t
int tr[N][26], idx; // Trie树
int id[N]; //通过节点号查字符串序号
int n;
int ne[N];
int sum[N];
//构建Trie树
void insert(char *s, int x) {
int p = 0;
for (int i = 0; s[i]; i++) {
int t = s[i] - 'a';
if (!tr[p][t]) tr[p][t] = ++idx;
p = tr[p][t];
}
id[p] = x;
}
int q[N];
void bfs() {
int hh = 0, tt = -1; //将队列的头和尾变量写在这里,可以有效防止多组测试数据的初始化问题
for (int i = 0; i < 26; i++)
if (tr[0][i]) q[++tt] = tr[0][i];
while (hh <= tt) {
int p = q[hh++];
for (int i = 0; i < 26; i++) {
int t = tr[p][i]; // p状态,通过i这条边,到达的新状态t; 也可以理解为是前缀
if (!t)
tr[p][i] = tr[ne[p]][i]; //节点 指向父节点失配指针的i这条边
else {
ne[t] = tr[ne[p]][i]; //失配指针指向父节点失配指针的i这条边
q[++tt] = t; //存在的要入队列
}
}
}
}
int main() {
while (scanf("%d", &n) && n) {
//多组测试数据
memset(tr, false, sizeof tr);
memset(id, false, sizeof id);
memset(sum, false, sizeof sum);
memset(ne, false, sizeof ne);
idx = 0;
for (int i = 1; i <= n; i++) {
scanf("%s", s[i]);
insert(s[i], i);
}
//构建失配指针
bfs();
//读入文本串
scanf("%s", t);
for (int i = 0, j = 0; t[i]; i++) {
j = tr[j][t[i] - 'a'];
for (int p = j; p; p = ne[p]) sum[id[p]]++;
}
for (int i = 1; i <= n; i++) Max = max(Max, sum[i]);
printf("%d\n", Max);
for (int i = 1; i <= n; i++)
if (Max == sum[i]) printf("%s\n", s[i]);
}
return 0;
}