• 红黑树详解


    摘要:

      红黑树是一种二叉查找树,但在每个结点上增加了一个存储位表示结点的颜色,可以是RED或者BLACK。通过对任何一条从根到叶子的路径上各个节点着色方式的限制,红黑树确保没有一条路径会比其他路径长出两倍,因而是接近平衡的。本章主要介绍了红黑树的性质、左右旋转、插入和删除。重点分析了在红黑树中插入和删除元素的过程,分情况进行详细讨论。当二叉查找树的高度较低时,这些操作执行的比较快,但是当树的高度较高时,这些操作的性能可能不比用链表好。红黑树(red-black tree)是一种平衡的二叉查找树,它能保证在最坏情况下,基本的动态操作集合运行时间为O(lgn)。本文结合上一章TreeMap源码分析一起阅读效果更好。

      1、红黑树的性质

      红黑树中的每个结点包含五个域:color、key、left、right和parent。如果某结点没有一个子结点或父结点,则该结点相应的指针parent域包含值为NIL。把NIL视为指向红黑树的外结点(叶子)的指针,而把带关键字的结点视为红黑树的内结点。红黑树结点结构如下所示:

     1 #define RED  0
     2 #define BLACK 1
     3 struct RedBlackTreeNode
     4 { 
     5     T key;
     6     struct RedBlackTreeNode * parent;
     7     struct RedBlackTreeNode * left;
     8     struct RedBlackTreeNode * right;
     9     int color;
    10 };
    

      红黑树的性质如下:

      (1)每个结点或是红色,或是黑色。

      (2)根结点是黑色。

      (3)每个叶子结点(NIL)是黑色。

      (4)如果有一个结点是红色,则它的两个儿子都是黑色。

      (5)对每个结点,从该结点到其孙子叶结点的所有路径上包含相同数目的黑色结点(黑高度相同)。

      如下图是一棵红黑树:

      从图可以看出NIL不是空指针,而是一个叶子结点。实际操作的时候可以将NIL视为哨兵,这样便于对黑红色进行操作。红黑树的操作主要是对内部结点操作,因为内部结点存储了关键字的值。为了便于讨论,忽略了叶子结点的,如是上图红黑树变成如下图所示:

      红黑树黑高度的概念:从某个结点x出发(不包含该结点)到达一个叶子结点的任意一条路径上,黑色结点的个数称为该结点的黑高度由红黑树的性质(5)可知,从该结点出发的所有下降路径都有相同的黑色结点个数。红黑树的黑高度定义为其根结点的黑高度。

      引理:一棵有n个内结点的红黑树的高度之多为2lg(n+1)。

      2、旋转

      在红黑树上进行结点插入和删除操作时,会改变树的结构形状,导致结果可能不满足了红黑树的某些性质,为了保证每次插入和删除操作后,仍然能维持红黑树的性质,需要改变树中某些结点的颜色和指针结构。其中的指针结构的改变通过旋转完成的。书中给出了两种旋转:左旋转和右旋转。如下图是旋转过程

      从图可以得出左右旋转的过程,假设对某个结点x进行左旋转,y是x的右孩子,则左旋转过程为:以x和y之间的链为“支轴”进行的,使得x的右孩子为y的左孩子,y的父节点为x的父节点,y的左孩子为x。书中给出了左旋转的伪代码如下:

     1 LEFT_ROTATE(T,x)
     2    y = right[x]   //获取右孩子
     3    rihgt[x] = left[y]  //设置x的右孩子为y的左孩子
     4    if left[y] != NIL
     5        then parent[left[x]] = x
     6     parent[y] = parent[x]  //设置y的父节点为x的父节点
     7     if parent[x] == NIL
     8        then root[T] = y
     9        else if x==left[parent[x]]
    10               then left[parent[x]] = y
    11               else  right[[parent[x]] = y
    12     left[y] = x  //设置y的左孩子为x
    13     parent[x] =y
    

      假设对某个结点y进行右旋转,x是y的左孩子,则左旋转过程为:y的左孩子设置为x的右孩子,将x的父节点设置为y的父节点,x的右孩子设置为y。书中并没有给出右旋转的伪代码,参照左旋转的伪代码很容易实现:

     1  RIGHT_ROTATE(T,y)
     2      x = left[y]    //获取左孩子
     3      left[y] = right[x] //设置y的左孩子为x的右孩子
     4      if right[x] != NIL
     5         then parent[right[x]] = y
     6      parent[x] = parent[y]  //设为x的父节点为y的父结点
     7      if parent[y] == NIL
     8          then root = x
     9          else if y== left[parent[y]]
    10                then left[parent[y]] = x
    11                else  right[parent[y]] = x
    12      right[x] = y //设置x的右孩子为y
    13      parent[y] = x
    

      为了更好的理解旋转操作,书中给出了一个左旋转的例如,如下图所示:

      3、插入

      红黑树插入一个新结点的过程RB_INSERT是在二叉查找树插入过程的基础上改进的,先按照二叉排序的插入过程插入到红黑树中,然后将新插入的结点标记为红色,然后调用一个辅助的过程RB_INSERT_FIXUP来调整结点并重新着色,使得满足红黑树的性质。书中给出了RB_INSERT的伪代码:

     1 RB_INSERT(T,z)
     2   y = NIL
     3   x =root(T)
     4   while x != NIL
     5        do y=x
     6            if key[z]<key[x]
     7              then x=left[x]
     8              else  x=right[x]
     9   parent[z] = y
    10   if y =NIL
    11      then root =z
    12      else if key[z] < key[y]
    13             then left[y] =z
    14             else  right[y] =z
    15    left[z] = NIL
    16    right[z] =NIL
    17    color[z] = RED  //新插入结点标记为红色
    18    RB_INSERT_FIXUP(T,z)  //进行调整,使得满足红黑树性质
    

      红黑树的插入过程最主要的是RB_INSERT_FIXUP过程,书中发了很大的篇幅进行介绍。首先分析了当插入一个新的结点后,会破坏红黑树的哪些性质,然后针对可能的破坏性质进行分类讨论并给出了给出了解决办法。因为每次插入的新元素标记为RED,这样可能性质2(根节点为黑色)和性质 4(一个红结点的左右孩子都是黑色的)被破坏。例如下图插入一个新结点,破坏了性质4。

      如果每次插入新的结点z导致红黑树性质被破坏,则之多只有一个性质被破坏,并且不是性质2就是性质4。违反性质2是因为z是根且为红色,违反性质4是因为z和其父节点parent[z]都是红色的。

      如果性质2被违反了,则红色的根必定是新增的结点z,它是树中唯一的内结点,由于z的父接点和两个子女都是NIL(黑色),不违反性质4。违反性质2在整个插入过程中只有这一次。所以对于违反性质2的结点,直接将其结点变成黑色即可。

      剩下的问题是对于违反性质4的处理,在插入新结点z之前,红黑树的性质没有被破坏。插入结点z后违反性质4,必定是因为z和其父亲结点 parent[z]都是红色的,此时只违反性质4,而没有违反其他性质。假设新插入结点z,导致红黑树性质4被破坏,此时z和其父节点parent[z] 都是红色,由于在插入结点z之前红黑树的性质没有被破坏,parent[z]是红色,很容易推出z的祖父结点parent[parent[z]]必定是黑色。此时根据parent[z]是parent[parent[z]]的左孩子还是右孩子进行讨论。因为左右之间是对称的,书中只给出了 parent[z]作为parent[parent[z]]的左孩子进行讨论的,然后给出了三种可能的情况。

      情况1):z的叔叔结点y是红色的

      此时parent[z]和y都是红色的,解决办法是将z的父节点parent[z]和叔叔结点y都着为黑色,而将z的祖父结点 parent[parent[z]]着为红色,然后从祖父结点parent[parent[z]]继续向上判断是否破坏红黑树的性质。处理过程如下图所示:  情况2):z的叔叔y是黑色的,而且z是右孩子

      情况3):z的叔叔y是黑色的,而且z是左孩子

      情况2和情况3中y都是黑色的,通过z是左孩子还是右孩子进行区分的。可以将情况2通过旋转为情况3。情况2中z是右孩子,旋转后成为情况3, 使得z变为左孩子,可以在parent[z]结点出使用一次左旋转来完成。无论是间接还是直接的通过情况2进入到情况3,z的叔叔y总是黑色的。在情况3中,将parent[z]着为黑色,parent[parent[z]]着为红色,然后从parent[parent[z]]处进行一次右旋转。情况2、 3修正了对性质4的违反,修正过程不会导致其他的红黑性质被破坏。修正过程如下图所示:

       给一个完整的例子来说明插入过程,如下图所示:

      书中给出了RB_INSERT_FIXUP的伪代码,伪代码中只给出了z的父节点为左孩子的情况,为右孩子的情况与左孩子的情况是对称的,只需将左孩子中的right换成left即可。

     1 RB_INSERT_FIXUP(T,z)
     2          while color[parent[z]]=RED
     3            do if parent[z] == left[parent[parent[z]]]
     4                   then y = right[parent[parent[z]]]
     5                        if color[y] == RED    //情况1,z的叔叔为红色
     6                             then color[parent[z]] = BLACK
     7                                  color[y] = BLACK
     8                                  color[parent[parent[z]]=RED 
    9                                   z= parent[parent[z]]
    10                              else if z == right[parent[z]]    //情况2,z的叔叔为黑色,z为右孩子
    11                                        then z = parent[z]
    12                                             LEFT_ROTATE(T,z)
    13                                         color[parent[z]]=BLACK    //情况3,z的叔叔为黑色,z为左孩子
    14                                         color[parent[parent[z]] = RED
    15                                         RIGHT_ROTATE(T, parent[parent[z]])
    16                  else (same as then clause with “right” and “left” exchanged)
    17    color(root(T)) = BLACK; //将根结点设置为黑色
    

      4、删除

      红黑树删除结点过程是在二叉查找树删除结点过程的基础改进的。与二叉查找树类似,删除的结点分为三种情况:<1>无左右孩子、<2>有左孩子或者右孩子、<3>既左孩子又有右孩子。红黑树在删除结点后需要检查是否破坏了红黑树的性质。如果删除的结点y是红色的,则删除后的树仍然是保持红黑树的性质,因为树中各个结点的黑高度没有改变,不存在两个相邻(父结点和子结点)的红色结点,y是红色不可能是根,所有根仍然是黑色。如果删除的结点z是黑色的,则这个是破坏了红黑树的性质,需要调用RB_DELETE_FIXUP进行调整。从删除结点y的唯一孩子结点x或者是NIL处开始调整。书中给出了RB_DELETE的伪代码:

     1 RB_DELETE(T,z)
     2      if left[z] ==NIL or right[z] == NIL
     3         then y=z
     4         else  y=TREE_SUCCESSOR(z)
     5     if left[y] != NIL
     6         then x=left[y]
     7         else  x=right[y]
     8     parent[x] = parent[y]
     9     if p[y] ==NIL
    10        then root[T] =x
    11        else if y = left[[prarnt[y]]
    12                    then left[parent[y]] = x
    13                    else  right[parent[y]] =x
    14      if y!=z
    15          then key[z] = key[y]
    16                copy y's data into z
    17      if color[y] == BLACK    //当被删除结点为黑色时候进行调整
    18          then RB_DELETE_FIXUP(T,x)
    19       return y
    

      书中分析了被删除结点y是黑色会产生的问题:首先,如果y是根,而y的一个红色孩子变成了新根,则违反了性质2。其次,如果x和parent[y](此时parent[x] = parent[y])都是红色,就违反了性质4。第三,删除y将会导致先前包含y的任何路径上黑结点个数减少1,违反了性质5。书中给出了解决第三个问题的办法:将结点x设为还有额外的一重黑色(给x增加了额外一重黑色,这样可以保证黑结点数目增加1个),即将任意包含结点x的路径上黑结点个数加1,这样可以保证性质5成立。当将黑色结点y被删除时,将其黑色“下推”至其子结点,导致问题变成为结点x可能即不是红,又不是黑,从而违反性质1。因为给x增加了一种颜色,即结点x是双重黑色或者是红黑色。这样就分别给包含x的路径上黑结点个数贡献2个或1个。但是x的color属性仍然是RED(如果x是红黑的)或BLACK(如果x是双重黑色)。换而言之,一个结点额外的黑色反映在x指向它,而不是它的color属性。

      过程RB_DELETE_FIXUP恢复性质1,2,4。对于恢复性质2、4很简单,因为x是红色,所有直接将x结点着为黑色即可。书中着重介绍了如何恢复性质1。此时x是黑色,需要根据x是左孩子还是右孩子两种情况进行恢复,因为左右是对称的,书中只给出了x是左孩子的恢复过程。将x作为第一个额外的黑色结点,从x结点开始循环,将额外的黑色结点沿着树向上移,直到:

      (1)x指向一个红黑结点,此时将x单独着为黑色。

      (2)x指向根,这时可以简单地消除那个额外的黑色,或者

      (3)做必要的旋转和颜色改变

      在循环过程中,x总是指向具有双重黑色的那个非根结点。设w是x的兄弟结点,因为x是双重黑色的,故w不可能是NIL。书中分四种情况讨论:

      情况1:x的兄弟w是红色的

      此时因为x是双重黑色,贡献两个黑色结点,所有w必有黑色孩子。此时将w着为黑色,parent[x]为红色,在对parent[x]做一次左旋转。此时x的新兄弟w是黑色,这样将情况1转换为情况2、3或4。情况1的处理过程下图所示:

      情况2:x的兄弟w是黑色的,而且w的两个孩子都是黑色的。

      处理过程是从x和w上去掉一重黑色,即x只有一重黑色而w着为红色,给x的父节点parent[x]添加额外黑色。处理过程如下图所示:

       情况3:x的兄弟w是黑色的,w的左孩子是红色的,右孩子是黑色的

      交换w和其左孩子left[w]的颜色,并对w进行右旋转。旋转后x的新兄弟w是一个有红色右孩子的黑结点,转换成了情况4。处理过程如下图所示:

      情况4:x的兄弟w是黑色的,而且w的右孩子是红色的。

      执行过程是将w的颜色设置为parent[x]的颜色,将parent[x]的颜色设置为黑色,将w的右孩子着为黑色,然后在parent[x]做一次右旋,最后将x设置为根root。处理过程如下图所示:

      书中给出了RB_DELETE_FIXUP的伪代码:

     1 RB_DELETE_FIXUP(T,x)
     2    while x!= root[T] and color[x] ==BLACK
     3          do if x == left[parent[x]]
     4                then w = right[parent[x]]
     5                     if color[w] == RED  //case 1 x的兄弟w是红色的
     6                        then color[w] = BLACK
     7                             color[parent[x]] = RED
     8                             LEFT_ROTATE(T,PARENT[x])
     9                             w = right[parent[x]]
    10                        if color[left[w]] == BLACK and color[right[w]] = BLACK
    11                           then color[w] = RED  //case 2
    12                             x = parent[x]
    13                            else if color[right[w]] =BLACK
    14                                   then color[left[w]] = BLACK //case 3
    15                                        color[w] = RED
    16                                        RIGHT_ROTATE(T,w)
    17                                        w = right[parent[x]]
    18                                color[w] = color[parent[x]] //case 4
    19                                color[parent[x]] = BLACK
    20                                color[right[w]] = BLACK
    21                                LEFT_ROTATE(T,parent[x])
    22                                x=root(T)
    23              else(same as then clasue with “right” and “left” exchanged)
    24      color[x]=BLACK
    
  • 相关阅读:
    grad-cam 、cam 和热力图,基于keras的实现
    高斯过程(转)
    Keras中使用LSTM层时设置的units参数是什么
    Real Time Credit Card Fraud Detection with Apache Spark and Event Streaming
    NodeJs+http+fs+request+cheerio 采集,保存数据,并在网页上展示(构建web服务器)
    NodeJs+Request+Cheerio 采集数据
    数组与对象的深浅复制
    Git(进击学习:远程仓库操作)-V3.0
    牛逼的css3:动态过渡与图形变换
    Git(远程仓库:git@oschina)-V2.0
  • 原文地址:https://www.cnblogs.com/wxgblogs/p/5513315.html
Copyright © 2020-2023  润新知