题意
JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的。ZYX需要指出GW文本生成器 v6生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?
题解
补集转化,(ans = 26 ^ m) - 不含任何单词的文本数。
$ dp[i][j] $ 表示考虑到了第i位,在ac自动机的第j个节点上。显然可以由$ dp[i][j] $ 转移到$ dp[i + 1][k (k是j的可走的儿子)] $ 上。
这位能不能填k,判断方法是从j开始向$ fail[j] $跳,看是不是有一个j有一个k儿子,并且k儿子上还有结束标记,只要有一个就证明如果i+1位填k就会让整个字符串出现AC自动机上的字符串,所以不能填k(要理解这一段需要理解ac自动机的fail的本质,而不是单纯背板)。
显然最后答案为 (sum dp[m][k])。
#include<set>
#include<queue>
#include<cstdio>
#include<vector>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
inline int read() {
int x = 0, flag = 1; char ch = getchar();
while (ch > '9' || ch < '0') { if (ch == '-') flag = -1; ch = getchar(); }
while (ch <= '9' && ch >= '0') { x = x * 10 + ch - '0'; ch = getchar(); }
return x * flag;
}
#define rep(ii, aa, bb) for (int ii = aa; ii <= bb; ii++)
#define ll long long
#define N 7001
#define ha 10007
int ch[N][26], no[N], fail[N], tot;
int dp[101][N];
char s[105];
void inzert() {
int i, u = 0, len = strlen(s);
rep(i, 0, len - 1) {
if (!ch[u][s[i] - 64]) ch[u][s[i] - 64] = ++tot;
u = ch[u][s[i] - 64];
}
no[u] = 1;
}
queue<int> q;
void build() {
rep(i, 1, 26) if (ch[0][i]) q.push(ch[0][i]);
while (q.size()) {
int u = q.front(); q.pop();
no[u] |= no[fail[u]];
rep(i, 1, 26) {
int v = ch[u][i];
if (v) {
fail[v] = ch[fail[u]][i];
q.push(v);
}
else ch[u][i] = ch[fail[u]][i];
}
}
}
int main() {
int n, m;
scanf("%d%d", &n, &m);
while (n--) {
scanf("%s", s);
inzert();
}
build();
dp[0][0] = 1;
rep(i, 1, m) rep(j, 0, tot)
if (!no[j] && dp[i - 1][j])
rep(k, 1, 26)
dp[i][ch[j][k]] = (dp[i][ch[j][k]] + dp[i - 1][j]) % ha;
int ans = 0, sna = 1;
rep(i, 0, tot) if (!no[i]) ans += dp[m][i];
rep(i, 1, m) sna = (sna * 26) % ha;
printf("%d", ((sna - ans) % ha + ha) % ha);
return 0;
}