• 字典树(前缀树)


    什么是字典树?

    字典树我觉得更应该叫做前缀树,因为用它来求字符串的前缀非常方便。

    通过上面这个图,我们不难发现:

    1、字典树用边表示字母

    2、有相同前缀的单词公用前缀节点(正是因为这个缘故我们去寻找一个字符串的前缀非常的方便)

    3、整棵树的根节点是空的。

    4、每个单词结束的时候用一个特殊字符表示,图中用涂黑个黑圈圈所经过的边的所有字母表示一个单词。

    基本操作:

    一、插入

    假设我们要插入字符串”in”。我们一开始位于根,也就是0号节点,我们用P=0表示。我们先看P是不是有一条标识着i的连向子节点的边。没有这条边,于是我们就新建一个节点,也就是1号节点,然后把1号节点设置为P也就是0号节点的子节点,并且将边标识为i。最后我们移动到1号节点,也就是令P=1。

    这样我们就把”in”的i字符插入到Trie中了。然后我们再插入字符n,也是先找P也就是1号节点有没有标记为n的边。还是没有,于是再新建一个节点2,设置为P也就是1号节点的子节点,并且把边标识为n。最后再移动到P=2。这样我们就把n也插入了。由于n是”in”的最后一个字符,所以我们还需要将P=2这个节点标记为终结点。

    现在我们再插入字符串”inn”。过程也是一样的,从P=0开始找标识为i的边,这次找到1号节点。于是我们就不用创建新节点了,直接移动到1号节点,也就是令P=1。再插入字符n,也是有2号节点存在,所以移动到2号节点,P=2。最后再插入字符n这时P没有标识为n的边了,所以新建3号节点作为2号节点的子节点,边标识为n,同时将3号节点标记为终结点: 

     

    重复上述操作,我们就可以得到最开始的那个图了!

    二、查找

    既然插入已经知道了,那么我们现在就来看看查找吧

    查找其实比较简单。我们只要从根节点开始,沿着标识着S[1] -> S[2] -> S[3] … -> S[S.len]的边移动,如果最后成功到达一个终结点,就说明S在Trie树中;如果最后无路可走,或者到达一个不是终结点的节点,就说明S不在Trie树中。 

     如果是查找”te”,就会从0开始经过5最后到达6。但是6不是终结点,所以te没在Trie树中。如果查找的是”too”,就会从0开始经过5和9,然后发现之后无路可走:9号节点没有标记为o的边连出去。所以too也不在Trie中。

    代码实现:

    数组方式实现
    要写代码实现一个Trie首先就要确定如何存储一个Trie结构。这里用一个二维数组来存储:

    int trie[MAX_NODE][CHARSET];
    int k;
    其中MAX_NODE是trie中最大能存储的节点数目,CHARSET是字符集的大小,k是当前trie中包含有多少个节点。Trie[i][j]的值是0表示trie树中i号节点,并没有一条连出去的边,满足边上的字符标识是字符集中第j个字符(从0开始);trie[i][j]的值是正整数x表示trie树中i号节点,有一条连出去的边,满足边上的字符标识是字符集中第j个字符,并且这条边的终点是x号节点。



    具体代码:

     1 #include <stdio.h>
     2 #include <string.h>
     3 #include <string>
     4 #include <iostream>
     5 #include <stdlib.h>
     6 #include <algorithm>
     7 
     8 using namespace std;
     9 const int MAX_NODE = 300001;
    10 const int CHARSET = 26;
    11 
    12 int trie[MAX_NODE][CHARSET]={0};
    13 int color[MAX_NODE]={0};
    14 int k = 1;
    15 
    16 void insert(char *w)
    17 {
    18     int len = strlen(w);
    19     int p = 0;
    20     for (int i=0;i<len;i++)
    21     {
    22         int c = w[i]-'a';
    23         if (!trie[p][c])
    24         {
    25             trie[p][c] = k;
    26             k++;
    27         }
    28         p = trie[p][c];
    29     }
    30     color[p] = 1;
    31 }
    32 
    33 
    34 int search(char *s)
    35 {
    36     int len = strlen(s);
    37     int p = 0;
    38     for (int i=0;i<len;i++)
    39     {
    40         int c = s[i]-'a';
    41         if (!trie[p][c])
    42             return 0;
    43         p = trie[p][c];
    44     }
    45     return color[p] == 1; //是不是其中的一个
    46 }
    47 
    48 
    49 int main()
    50 {
    51 #ifndef ONLINE_JUDGE
    52     freopen("../in.txt","r",stdin);
    53 #endif
    54     int t,q;
    55     char s[20];
    56     scanf("%d%d", &t,&q);
    57     while(t--){
    58         scanf("%s", s);
    59         insert(s);
    60     }
    61     while(q--){
    62         scanf("%s", s);
    63         if(search(s)) printf("YES
    ");
    64         else printf("NO
    ");
    65     }
    66     return 0;
    67 }

    参考博客:https://blog.csdn.net/weixin_39778570/article/details/81990417

           https://www.cnblogs.com/TheRoadToTheGold/p/6290732.html

  • 相关阅读:
    天才AI少年范浩强坚信“弄斧要到班门”
    向Excel说再见,神级编辑器统一表格与Python
    疯狂脑机接口计划:马斯克的 “读心术”
    Jenkins 学习资料
    VMware: windows8 与 虚拟机ubuntu 14.04 共享文件夹
    [转载]一个老软件测试工程师的日志
    python 解析 配置文件
    借助github搭建自己的博客
    [转载]你需要知道的 16 个 Linux 服务器监控命令
    [转载]Linux服务器性能评估与优化
  • 原文地址:https://www.cnblogs.com/-Ackerman/p/11209724.html
Copyright © 2020-2023  润新知