• 关于AC自动机的一些思考


    AC自动机的基本流程

    先用所有模式串建立一颗Trie树

    然后去计算Trie树每一个节点的fail指针(失配后应该转移到哪个节点)

    同时额外补一些边,把Trie树改为Trie图

    建立AC自动机的代码

    解释一下这个补边是什么操作

    比如这棵Trie树

    先考虑没有额外补边的情况

    如果在9号节点尝试沿着k边走,发现nxt[x][k]为空

    那么我们为了能找到一个能匹配的位置

    我们只能沿着fail指针回跳,去寻找一个nxt[x][k]不为空的节点

    这个回跳的过程复杂度并不太可以均摊,导致匹配的复杂度有些问题

    为了优化这一点

    其实也就是我们需要对于每个节点快速定位出他的第一个nxt[pa][k]不为空的祖先(指fail树上的祖先)

    所以引入了额外边这个方法

    其实很简单就是我们把那些nxt[x][k]为空的节点直接指向他祖先的nxt[pa][k]

    计算的时候可以简单的利用nxt[x][k]=nxt[f[x]][k]来实现(有点递推的感觉)

    感觉这个技巧和路径压缩是有些类似的

    根据这种方法构建的Trie图,显然每一个节点的所有nxt[x][k]都是非空的

    听说有的时候不能去建这个Trie图,必须只有Trie图

    那也好办,只需要把额外边换一个数组来储存即可。

  • 相关阅读:
    KMP算法
    数据库建立索引为什么会加快查询速度
    腾讯2014实习生4月20日笔试题(分析与解答)
    智能指针auto_ptr & shared_ptr
    用C++实现一个不能被继承的类
    2014金山笔试_编写一个数组类 MyVector
    TCP分组交换详解
    子网掩码的计算
    服务器端 安装svn
    yii2之ActiveForm表单使用
  • 原文地址:https://www.cnblogs.com/Creed-qwq/p/13742767.html
Copyright © 2020-2023  润新知