• C 关于二叉查找树的回顾,并简述结构接口设计


    前言

       最经想改写C用的配置读取接口, 准备采用hash或二叉树提到原先用的链表,提高查找效率.
    就回顾一下二叉树,这里分享一下二叉查找树,代码很精简的, 适合学习运用二叉树查找.

    需要基础

    1.具备C基础知识

    2.知道数据结构,最好知道一点二叉树结构

    能够学到

    1.稳固二叉查找树

    2.C良好编码格式习惯

    3.tree 数据结构几种流行套路(设计)

    参照

    1.二叉查找树简单分析 http://www.cppblog.com/cxiaojia/archive/2012/08/09/186752.html

    (上面那个博文, 图形讲解的恨透,但是那种tree数据结构,不要参照)

    正文

    1 直接奔主题 说二叉查找树难点

    1.1 简单说一下二叉查找树原理和突破

      二叉树也是个经典的数据结构,但是工作中用的场景不多,但是我们常用过,例如map,自带排序的k-v结构.

    二叉树相比双向链表在改变了插入和删除方式,使查找代价变小.因而适用领域在快速查找的领域.对于那种快速删除,

    快速插入的领域并不适合. 

      我们今天主要回顾的是二叉查找(搜索)树. 首先看看数据结构如下

    /*
    *  这里简单的温故一下 , 二叉查找树
    *一切从简单的来吧
    */
    typedef int node_t;
    typedef struct tree {
        node_t v; //这里简单测试一下吧,从简单做起
    
        struct tree* lc;
        struct tree* rc;
    } *tree_t;

    上面比较简陋,不是很通用,方便了解原理设计,最后会带大家设计一些通用的二叉树结构. 这里扯一点,

    结构会影响算法,算法依赖特定的结构.蛋和鸡的问题,先有一个不好的蛋,孵化一个不好的鸡,后来鸡下了很多蛋,其中一个蛋很好,

    孵化了一个很好的鸡,最后蛋鸡良好循环出现了.

    对于二叉查找树,除了删除比较复杂一点,其它的还是很大众的代码,这里从如何找到一个结点的父节点出发.看下面代码

    /*
    *  查找这个结点的父结点
    * root    : 头结点
    * v    : 查找的结点
    *         : 返回这个v值的父亲结点,找不见返回NULL,可以返回孩子结点
    */
    tree_t
    tree_parent(tree_t root, node_t v, tree_t* pn)
    {
        tree_t p = NULL;
        while (root) {
            if (root->v == v)
                break;
            p = root;
            if (root->v > v)
                root = root->lc;
            else
                root = root->rc;
        }
    
        if (pn) //返回它孩子结点
            *pn = root;
    
        return p;
    }

    本质思路是,构建一个指针p保存上一个结点.这个函数相比其它函数 tree_parent 这里多返回当前的孩子结点.一个函数顺带做了两件事.

    这是一个突破.推荐学习,同等代价做的事多了,价值也就提升了.

    下面说一下 二叉查找树 删除原理(从上面参照文中截得,这个比较详细,但是代码写的水)

    代码实现如下,有点精简,多看几遍,或者调试几遍理解更容易写.

    /*
    *  删除结点
    * proot : 指向头结点的结点
    * v     : 待删除的值
    */
    void
    tree_delete(tree_t* proot, node_t v)
    {
        tree_t root, n, p, t;//n表示v结点,p表示父亲结点
        if ((!proot) || !(root = *proot)) 
            return;
        //这里就找见 v结点 n和它的父亲结点p
        p = tree_parent(root, v, &n);
        if (!n) //第零情况 没有找见这个结点直接返回
            return;
    
        //第一种情况,删除叶子结点,直接删除就可以此时t=NULL; 第二情况 只有一个叶子结点
        if (!n->lc || !n->rc) {
            if (!(t = n->lc)) //找见当前结点n的唯一孩子结点
                t = n->rc;
            if (!p)
                *proot = NULL;
            else {
                if (p->lc == n) //让当前结点的父亲收养这个它唯一的孩子
                    p->lc = t;
                else
                    p->rc = t;
            }
            //删除当前结点并返回,C要是支持 return void; 语法就好了
            free(n); 
            return;
        }
    
        //第三种情况, 删除的结点有两个孩子
        //将当前结点 右子树中最小值替代为它,继承王位,它没有左儿子
        for (t = n->rc; t->lc; t = t->lc)
            ;
        n->v = t->v;//用nr替代n了,高效,并让n指向找到t的唯一右子树,
        tree_delete(&n->rc, t->v);//递归删除n右子树中最小值, 从t开始,很高效
    }

    第一步找见这个结点和它父亲结点,没找见它直接返回,父亲结点为了重新配置继承关系.

    对于 要删除 叶子结点或只有孩子的结点, 删除 走 if(!n->lc || !n->rc) 分支不同是t

    当只为叶子结点 t = NULL, 当有一个孩子结点, t = 后继结点,将其二和一了,是一个突破.

    最后 删除 有两个孩子的结点, 我们的做法,将 它 右子树中最小值找到,让其替代自己, 后面在右子树中删除 那个结点.

    1.2 简单扩展一下 递归的潜规则

      递归大多数流程如下

    //数据打印函数,全部输出,不会打印回车,中序递归
    void
    tree_print(tree_t root)
    {
        if (root) { //简单中序找到最左结点,打印
            tree_print(root->lc);
            printf("%d ", root->v);
            tree_print(root->rc);
        }
    }

    这样的递归的方式 是

     tree_print_0 => tree_print_1 => tree_print_2 => tree_print_3 => tree_print_2 => tree_print_1 => tree_print_0

    先入函数栈后出函数栈,递归深度太长会爆栈.上面就是大多数递归的方式.

    递归中有一种特殊的尾递归.不需要依赖递归返回结果.一般递归代码在函数最尾端.例如上 删除代码,结构如下

     tree_delete_0 => tree_delete_0 => tree_delete_1 =>  tree_delete_1 =>  tree_delete_2 =>  tree_delete_2 =>  tree_delete_3 =>

    这里代码就是入栈出栈,跳转到新的递归中.属于编译器关于递归的优化,不依赖递归返回的结果,最后一行,一般都优化为尾递归很安全.

    入不同行开发,潜规则还是比较多的.扯一点, 一天晚上出租车回来和司机瞎扯淡, 他说有一天带一个导演,那个导演打电话给一个女孩父亲,

    告诉他,他女儿今天晚上来他房间,痛斥一顿让她走了,后面就联系女孩父亲,女孩父亲神回复,导演你该潜你就潜. 估计当时那个导演心里就有

    一万个草泥马奔过,怎么就有这么一对活宝父女.

    人生活宝多才欢乐,快乐才会笑着带着'class'.

    1.3 说一下接口和测试代码

      一般良好安全的编程喜欢是,先写接口,再写总的测试代码,后面代码接口打桩挨个测试. 这里总的接口和测试代码如下

    /*
    * 在二叉查找树中插入结点
    * proot : 头结点的指针
    * v     : 待插入变量值,会自动分配内存
    */
    void tree_insert(tree_t* proot, node_t v);
    
    //数据打印函数,全部输出,不会打印回车,中序递归
    void tree_print(tree_t root);
    
    /*
    *  在这个二叉查找树中查找 值为v的结点,找不见返回NULL
    * root    : 头结点
    * v    : 查找结点值
    *         : 返回值为查找到的结点,找不见返回NULL
    */
    tree_t tree_search(tree_t root, node_t v);
    
    /*
    *  查找这个结点的父结点
    * root    : 头结点
    * v    : 查找的结点
    *         : 返回这个v值的父亲结点,找不见返回NULL,可以返回孩子结点
    */
    tree_t tree_parent(tree_t root, node_t v, tree_t* pn);
    
    /*
    *  删除结点
    * proot : 指向头结点的结点
    * v     : 待删除的值
    */
    void tree_delete(tree_t* proot, node_t v);
    
    /*
    *  删除这个二叉查找树,并把根结点置空
    * proot : 指向根结点的指针
    */
    void tree_destroy(tree_t* proot);
    
    //简单输出帮助宏
    #define TREE_PRINT(root) 
        puts("当前二叉查找树的中序数据如下:"), tree_print(root), putchar('
    ')
    
    //简单的主函数逻辑
    int main(int argc, char* argv[])
    {
        tree_t root = NULL;
        //先创建一个二叉树 试试    
        node_t a[] = { 8,4,5,11,2,3,7,-1,9,0,1,13,12,10 };
        //中间临时变量
        tree_t tmp;
        node_t n;
    
        int i = -1;
        //插入数据    
        while (++i<sizeof(a) / sizeof(*a))
            tree_insert(&root, a[i]);
    
        //简单输出数据
        TREE_PRINT(root);
    
        //这里查找数据,删除数据打印数据
        n = 5;
        tmp = tree_search(root, n);
        if (tmp == NULL)
            printf("root is no find %d!
    ", n);
        else
            printf("root is find %d, is %p,%d!
    ", n, tmp, tmp->v);
    
        //查找父亲结点
        n = 12;
        tmp = tree_parent(root, n, NULL);
        if (tmp == NULL)
            printf("root is no find %d!
    ", n);
        else
            printf("root is find parent %d, is %p,%d!
    ", n, tmp, tmp->v);
    
        //删除测试
        n = 8;
        tree_delete(&root, n);
        TREE_PRINT(root);
    
        n = 9;
        tree_delete(&root, n);
        TREE_PRINT(root);
    
        //释放资源
        tree_destroy(&root);
    
        system("pause");
        return 0;
    }

    测试代码就是把声明的接口挨个测试一遍.对于代码打桩意思就是简单的实现接口,让其能编译通过.如下

    /*
    *  在这个二叉查找树中查找 值为v的结点,找不见返回NULL
    * root    : 头结点
    * v    : 查找结点值
    *         : 返回值为查找到的结点,找不见返回NULL
    */
    tree_t
    tree_search(tree_t root, node_t v)
    {
    
        return NULL;
    }

    就是打桩. 到这里基本都万事具备了.设计思路有了,原理也明白了,下面上一个完整案例看结果.

    2.汇总代码, 看运行结果

      首先看运行结果截图

    查找,删除,打印都来了一遍, 具体的实现代码如下

    #include <stdio.h>
    #include <stdlib.h>
    #include <errno.h>
    #include <string.h>
    
    //控制台打印错误信息, fmt必须是双引号括起来的宏
    #ifndef CERR
    #define CERR(fmt, ...) 
        fprintf(stderr,"[%s:%s:%d][error %d:%s]" fmt "
    ",
             __FILE__, __func__, __LINE__, errno, strerror(errno), ##__VA_ARGS__)
    
    //检测并退出的宏
    #define CERR_EXIT(fmt, ...) 
        CERR(fmt, ##__VA_ARGS__), exit(EXIT_FAILURE)
    
    #endif/* !CERR */
    
    /*
    *  这里简单的温故一下 , 二叉查找树
    *一切从简单的来吧
    */
    typedef int node_t;
    typedef struct tree {
        node_t v; //这里简单测试一下吧,从简单做起
    
        struct tree* lc;
        struct tree* rc;
    } *tree_t;
    
    /*
    * 在二叉查找树中插入结点
    * proot : 头结点的指针
    * v     : 待插入变量值,会自动分配内存
    */
    void tree_insert(tree_t* proot, node_t v);
    
    //数据打印函数,全部输出,不会打印回车,中序递归
    void tree_print(tree_t root);
    
    /*
    *  在这个二叉查找树中查找 值为v的结点,找不见返回NULL
    * root    : 头结点
    * v    : 查找结点值
    *         : 返回值为查找到的结点,找不见返回NULL
    */
    tree_t tree_search(tree_t root, node_t v);
    
    /*
    *  查找这个结点的父结点
    * root    : 头结点
    * v    : 查找的结点
    *         : 返回这个v值的父亲结点,找不见返回NULL,可以返回孩子结点
    */
    tree_t tree_parent(tree_t root, node_t v, tree_t* pn);
    
    /*
    *  删除结点
    * proot : 指向头结点的结点
    * v     : 待删除的值
    */
    void tree_delete(tree_t* proot, node_t v);
    
    /*
    *  删除这个二叉查找树,并把根结点置空
    * proot : 指向根结点的指针
    */
    void tree_destroy(tree_t* proot);
    
    //简单输出帮助宏
    #define TREE_PRINT(root) 
        puts("当前二叉查找树的中序数据如下:"), tree_print(root), putchar('
    ')
    
    //简单的主函数逻辑
    int main(int argc, char* argv[])
    {
        tree_t root = NULL;
        //先创建一个二叉树 试试    
        node_t a[] = { 8,4,5,11,2,3,7,-1,9,0,1,13,12,10 };
        //中间临时变量
        tree_t tmp;
        node_t n;
    
        int i = -1;
        //插入数据    
        while (++i<sizeof(a) / sizeof(*a))
            tree_insert(&root, a[i]);
    
        //简单输出数据
        TREE_PRINT(root);
    
        //这里查找数据,删除数据打印数据
        n = 5;
        tmp = tree_search(root, n);
        if (tmp == NULL)
            printf("root is no find %d!
    ", n);
        else
            printf("root is find %d, is %p,%d!
    ", n, tmp, tmp->v);
    
        //查找父亲结点
        n = 12;
        tmp = tree_parent(root, n, NULL);
        if (tmp == NULL)
            printf("root is no find %d!
    ", n);
        else
            printf("root is find parent %d, is %p,%d!
    ", n, tmp, tmp->v);
    
        //删除测试
        n = 8;
        tree_delete(&root, n);
        TREE_PRINT(root);
    
        n = 9;
        tree_delete(&root, n);
        TREE_PRINT(root);
    
        //释放资源
        tree_destroy(&root);
    
        system("pause");
        return 0;
    }
    /*
    * 在二叉查找树中插入结点
    * proot : 头结点的指针
    * v     : 待插入变量值,会自动分配内存
    */
    void
    tree_insert(tree_t* proot, node_t v)
    {
        tree_t n, p = NULL, t = *proot;
    
        while (t) {
            if (t->v == v) //不让它插入重复数据
                return;
            p = t; //记录上一个结点
            t = t->v > v ? t->lc : t->rc;
        }
    
        //这里创建结点,创建失败直接退出C++都是这种做法
        n = calloc(sizeof(struct tree), 1);
        if (NULL == n)
            CERR_EXIT("calloc struct tree error!");
        n->v = v;
    
        //这里插入了,开始第一个是头结点
        if (NULL == p) {
            *proot = n;
            return;
        }
        if (p->v > v)
            p->lc = n;
        else
            p->rc = n;
    }
    
    //数据打印函数,全部输出,不会打印回车,中序递归
    void
    tree_print(tree_t root)
    {
        if (root) { //简单中序找到最左结点,打印
            tree_print(root->lc);
            printf("%d ", root->v);
            tree_print(root->rc);
        }
    }
    
    /*
    *  在这个二叉查找树中查找 值为v的结点,找不见返回NULL
    * root    : 头结点
    * v    : 查找结点值
    *         : 返回值为查找到的结点,找不见返回NULL
    */
    tree_t
    tree_search(tree_t root, node_t v)
    {
        while (root) {
            if (root->v == v)
                return root;
            if (root->v > v)
                root = root->lc;
            else
                root = root->rc;
        }
    
        return NULL;
    }
    
    /*
    *  查找这个结点的父结点
    * root    : 头结点
    * v    : 查找的结点
    *         : 返回这个v值的父亲结点,找不见返回NULL,可以返回孩子结点
    */
    tree_t
    tree_parent(tree_t root, node_t v, tree_t* pn)
    {
        tree_t p = NULL;
        while (root) {
            if (root->v == v)
                break;
            p = root;
            if (root->v > v)
                root = root->lc;
            else
                root = root->rc;
        }
    
        if (pn) //返回它孩子结点
            *pn = root;
    
        return p;
    }
    
    /*
    *  删除结点
    * proot : 指向头结点的结点
    * v     : 待删除的值
    */
    void
    tree_delete(tree_t* proot, node_t v)
    {
        tree_t root, n, p, t;//n表示v结点,p表示父亲结点
        if ((!proot) || !(root = *proot)) 
            return;
        //这里就找见 v结点 n和它的父亲结点p
        p = tree_parent(root, v, &n);
        if (!n) //第零情况 没有找见这个结点直接返回
            return;
    
        //第一种情况,删除叶子结点,直接删除就可以此时t=NULL; 第二情况 只有一个叶子结点
        if (!n->lc || !n->rc) {
            if (!(t = n->lc)) //找见当前结点n的唯一孩子结点
                t = n->rc;
            if (!p)
                *proot = t;
            else {
                if (p->lc == n) //让当前结点的父亲收养这个它唯一的孩子
                    p->lc = t;
                else
                    p->rc = t;
            }
            //删除当前结点并返回,C要是支持 return void; 语法就好了
            free(n); 
            return;
        }
    
        //第三种情况, 删除的结点有两个孩子
        //将当前结点 右子树中最小值替代为它,继承王位,它没有左儿子
        for (t = n->rc; t->lc; t = t->lc)
            ;
        n->v = t->v;//用nr替代n了,高效,并让n指向找到t的唯一右子树,
        tree_delete(&n->rc, t->v);//递归删除n右子树中最小值, 从t开始,很高效
    }
    
    
    //采用后序删除
    static void __tree_destroy(tree_t root)
    {
        if (root) {
            __tree_destroy(root->lc);
            __tree_destroy(root->rc);
            free(root);
        }
    }
    
    /*
    *  删除这个二叉查找树,并把根结点置空
    * proot : 指向根结点的指针
    */
    void
    tree_destroy(tree_t* proot)
    {
        if (proot)
            __tree_destroy(*proot);
        *proot = NULL;
    }

    大家自己联系一下,代码不多,容易学习顺带回顾一下数据结构中二叉树结构,关于其中 tree_destroy 编码方式,是个人的编程习惯.

    在C中变量声明后没有默认初始化, 所以习惯有这样的代码

    struct sockaddr_in sddr;
    memset(&sddr, 0, sizeof sddr);

    我觉得这样麻烦,我习惯的写法是

    struct sockaddr_in saddr = { AF_INET };

    利用了一个C声明初始化潜规则,上面和下面代码转成汇编后也许都相似.后面写法,默认编译器帮我们把它后面没初始化部分置成0.

    还有一个习惯,可以允许一个烂的开始,必须要有一个perfect结束,参照老C++版本的智能指针,也叫破坏指针. 做法就是

    char* p = malloc(1);
    free(p);
    p = NULL;

    防止野指针.一种粗暴的做法,所以个人习惯在结束的时候多'浪费'一点时间回顾一下以前,再将其彻底抹除,等同于亚洲飞人直接删除所有回忆的做法.

    编程的实现.最后再吐槽一下,为什么C++很烂,因为看了无数的书,还是不知道它要闹哪样.它就是一本易筋经,左练右练上练下练都可以,终于练成了

    恭喜你,这张一张残废证收下.

    再扯一点, 为什么C++中叫模板,上层语言中叫泛型? 哈哈,可以参照全特化和偏(范)特化.这里卖一个关子,但是本文中最后会有案例解决.

    3.继往开来,了解一些数据结构设计的模式 

      上面基本都扯的差不多了,这里分享C中几种的数据结构设计模式.

    第一种 一切解'对象'

    /*
     * C中如何封装一个 tree '结构'(结构决定算法)
     */
    
    /*
     * 第一种思路是 一切皆'对象'
     */
    struct otree {
        void* obj;
        struct otree* lc;
        struct otree* rc;
    };
    
    struct onode {
        int id;
        char* name;
    };
    
    // obj => &struct onde的思路,浪费了4字节,方便管理

    大家看到那个 void*应该就明白了吧等同于上层语言中Object对象.

    第二种 万物皆'泛型'

    /*
     * 第二种思路是 万物皆'泛型'
     */
    struct tree_node {
        struct tree_node *lc;
        struct tree_node *rc;
    };
    
    #define TREE_NODE 
        struct tree_node *__tn
    
    struct ttree {
        TREE_NODE; //必须在第一行,不在第一行需要计算偏移量 offset
    
        //后面就是结构了
        int id;
        char* name;
    };

    下面这种相比上面这种节约4字节.缺点调试难.还有好多种例如模板流,特定写死流. 这里扩展一下另一个技巧

    关于C中宏简化结构的代码

    /* IPv6 address */
    struct in6_addr
    {
        union
        {
            uint8_t    __u6_addr8[16];
    #if defined __USE_MISC || defined __USE_GNU
            uint16_t __u6_addr16[8];
            uint32_t __u6_addr32[4];
    #endif
        } __in6_u;
    #define s6_addr            __in6_u.__u6_addr8
    #if defined __USE_MISC || defined __USE_GNU
    # define s6_addr16        __in6_u.__u6_addr16
    # define s6_addr32        __in6_u.__u6_addr32
    #endif
    };

    是不是很新奇,但是这样的代码,上层包块库都不推荐用,这些都是内核层的定义.用的越多越容易出错.

    到这里基本就快结束了,上面介绍的几种结构设计思路,大家需要自己揣摩. 特别有价值.搞明白.

    再扯一点,很久以前对这样的结构不明白

    struct mem_storage{
       union {
           int again;
           void* str; 
       } mem;
       .....
    };

    上面again 是干什么的,后来才明白了,主要作用是设定内存对齐的字节数.方便移植.使其结构体内存结构是一样,也方便CPU读取.

    思考了很多但是还不明白, 那就对了,说明你还有追求!

    这里再扩展一下, 有时候

    /*
     常遇见下面代码
     */
    void ss_free(void* arg)
    {
       if(....){
         .....
         free(arg);
         return;
       }
      
        ....  
    }

    真心 希望 C中提供 return void; 语法,

    这样就可以写成

    return free(arg);
    
    //或者
    return (void)check(arg);

    这样代码会更精简, 更好看. 这里也可以通过宏设计处理

    #define return_func(f, ...) 
        f(##__VA_ARGS__); 
        return

    属于伪造吧,希望C委员会提供 return void; 语法!!

    后记

      错误是难免的,有问题提示马上改. 下次有机会将二叉树讲透,关于设计开发库中用的二叉树结构都来一遍,最后分享一下,实际运用的

    库案例.拜~,

      有时候在想如果不以经济建设为中心,是不是人会更有意思一点? 有一款小网游叫中国, 挖了无数坑,就希望大R去充值,diao丝去陪练.哈哈

       

  • 相关阅读:
    4.10Python数据处理篇之Matplotlib系列(十)---文本的显示
    4.9Python数据处理篇之Matplotlib系列(九)---子图分布
    4.8Python数据处理篇之Matplotlib系列(八)---Figure的学习
    4.7Python数据处理篇之Matplotlib系列(七)---matplotlib原理分析
    4.6Python数据处理篇之Matplotlib系列(六)---plt.hist()与plt.hist2d()直方图
    4.5Python数据处理篇之Matplotlib系列(五)---plt.pie()饼状图
    4.4Python数据处理篇之Matplotlib系列(四)---plt.bar()与plt.barh条形图
    4.3Python数据处理篇之Matplotlib系列(三)---plt.plot()折线图
    Angular 定时器$timeout和$interval,延时调用
    javascript中top、clientTop、scrollTop、offsetTop的讲解(转载加总结)
  • 原文地址:https://www.cnblogs.com/life2refuel/p/5154469.html
Copyright © 2020-2023  润新知