AC自动机 相当于就是Trie树 + KMP
Trie树就是把关键字按字母存在树上 每一条路径构成一个单词 像这样
主要有fail指针 success指针和 emit指针
fail指针相当于KMP中的next数组
如果某节点a的父节点的fail指针指向的节点的孩子中有和这个节点a相同的字母的节点b 那么这个a的fail指针就指向b
构造fail指针的复杂度是O(n) n是所有树中所有单词的长度
匹配过程分两种情况:
- 当前字符匹配,表示从当前节点沿着树边有一条路径可以到达目标字符,此时只需沿该路径走向下一个节点继续匹配即可,目标字符串指针移向下个字符继续匹配;
- 当前字符不匹配,则去当前节点fail指针所指向的字符继续匹配,匹配过程随着指针指向root结束。重复这2个过程中,直到模式串走到结尾为止。
假设有N个模式串,平均长度为L;文章长度为M。
建立Trie树:O(N*L)
建立fail指针:O(N*L)
模式匹配:O(M*L) (注:之所以要乘以一个L,是因为在统计的时候需要顺着链回溯到root结点)
所以,总时间复杂度为:O( (N+M)*L )