• 字典树(前缀树/后缀树)


    用途

    有人说是为了统计字频,可我觉得 HashMap 就可以完成。有人说比 HashMap 占用内存要小,但我感觉小也小不到哪里去。

    有人说为了查询字符,还是那句话,HashSet 表示我也可以。

    也许在 Hash 没有出来前,它也许在这些领域占有一席之地。目前,从数据结构来看,我认为它的作用也许在以下方面比较突出:

    • 也被称为 前缀树,就是剔除相同的前缀操作,这里看不懂很正常,后面慢慢说
    • 搜索提示,讲了下面结构你就理解了

    结构

    这就是字典树,我们沿着最左边走一遭,那就是 JOHNNY。

    先来说下之前提到的第一个用途,前缀树。比如有两个字符串, JOHNNY 和 JOHN。可以发现两者拥有前缀,JOHN,这有什么作用呢?数据压缩的时候也许会用到,可以看这题。

    820. 单词的压缩编码

    接下来,说说第二个功能。比如你在搜索框中输入了 JO,那我根据字典树,我猜测你要找的也许是 JOHNNY 或者 JOE,然后我会给你提示。

    定义数据结构

    讲一个数据结构,主要就讲,如何去定义一个数据结构,然后涉及相关的操作,这里就是添加(搭建)、删除操作。

    因为这也是一个树的结构,只不过这里不一定是二叉树,上面的图有点误导,我们如果要表示英文字符的话,那么从根节点出发,应该有26个字符可供选择。

    class NodeTree{
        // 用数组编号代替字符,会减小搜索查询时间复杂度
        NodeTree[] charNode;
        // 记录下面子节点被使用个数,为了删除操作
        int count = 0;
        NodeTree(){
            charNode = new NodeTree[26];
        }
    }
    

    添加(构建)

    添加和构建,本质是一样的,构建是通过一定数目的添加实现的。

        // 直接添加字符串
    	public void addString(String s, NodeTree root){
            for(int i = 0; i < s.length(); i++){
                char c = s.charAt(i);
                if(root.charNode[c-'a']==null)
                    root.charNode[c-'a'] = new NodeTree();
                root = root.charNode[c-'a'];
                root.count++;
            }
        }
    	// 单个添加字符
        public NodeTree addChar(char c, NodeTree root){
            if(root.charNode[c-'a']==null)
                root.charNode[c-'a'] = new NodeTree();
            root.count++;
            return root.charNode[c-'a'];
        }
    

    为了验证是否添加成功,写一个查找字符的函数

        public boolean findString(String s, NodeTree root){
            boolean flag = false;
            for(int i = 0; i < s.length(); i++){
                char c = s.charAt(i);
                if(root.charNode[c-'a']==null)
                    return flag;
                root = root.charNode[c-'a'];
            }
            return !flag;
        }
    

    小测试

    public class TrimTree {
        public static void main(String[] args) {
            NodeTree root = new NodeTree();
            root.addString("test", root);
            System.out.println(root.findString("tes", root));
            System.out.println(root.findString("test", root));
            System.out.println(root.findString("tests", root));
        }
    }
    // 输出
    true
    true
    false
    

    上面这个测试,向字典树中写入,test,然后对test的前缀,tes进行查询,可以正常查询到。

  • 相关阅读:
    rsync服务器与客户端配置文件
    0170001799 SQL Parsing Messages .
    RHEL修改最大文件打开数,关于epoll socket Too many open files问题的解决
    精美网页集锦
    Linux 相关发音
    【转】如何提升工作中的影响力
    2010年50大最佳工作场所 谷歌仅排名第14
    加密解密工具gpg (GnuPG)
    【转】易经与软件开发
    常见的开放源代码许可证类型
  • 原文地址:https://www.cnblogs.com/zhouzhiyao/p/12547142.html
Copyright © 2020-2023  润新知