• [STL源码剖析]RB-tree的插入操作


    RB-tree的性质

    对于RB-tree,首先做一个了解,先看一张维基百科的RB-tree:

    再看RB-tree的性质:

    性质1. 节点是红色或黑色。
    
    性质2. 根是黑色,所有叶子都是黑色(叶子节点指的是NIL节点)。。
    
    性质3. 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
    
    性质4. 从任一节点到其每个叶子的所有简单路径 都包含相同数目的黑色节点。
    

    二查搜索树的插入删除操作

    在展开红黑树之前, 首先来看看普通二叉搜索树的插入和删除. 插入很容易理解, 比当前值大就往右走, 比当前值小就往左走。

    这里详细展开的是删除操作:

    二叉树的删除操作有一个技巧, 即在查找到需要删除的节点 X;

    接着我们找到要么在它的左子树中的最大元素节点 M、要么在它的右子树中的最小元素节点 M, 并交换(M,X). 此时, M 节点必然至多只有一个孩子;

    最后一个步骤就是用 M 的子节点代替 M 节点就完成了。

    所以, 所有的删除操作最后都会归结为删除一个至多只有一个孩子的节点, 而我们删除这个节点后, 用它的孩子替换就好了. 将会看到 sgi stl map 就是这样的策略.

    在红黑树删除操作讲解中, 我们假设代替 M 的节点是 N(下面的讲述不再出现 M).

    RB-tree的插入操作

    插入新节点总是红色节点, 因为不会破坏性质 5, 尽可能维持所有性质.

    假设, 新插入的节点为 N, N 节点的父节点为 P, P 的兄弟(N 的叔父)节点为 U, P 的父亲(N 的爷爷)节点为 G. 所以有如下的印象图:

    插入节点的关键是:

    插入新节点总是红色节点
    如果插入节点的父节点是黑色, 能维持性质
    如果插入节点的父节点是红色, 破坏了性质. 故插入算法就是通过重新着色或旋转, 来维持性质
    

    插入算法详解如下, 走一遍红黑树维持其性质的过程:

    第 0.0 种情况, N 为根节点, 直接 N->黑. over
    第 0.1 种情况, N 的父节点为黑色, 这不违反红黑树的五种性质. over

    第 1 种情况, N,P,U 都红(G 肯定黑). 策略: G->红, N,P->黑. 此时, G 红, 如果 G 的父亲也是红, 性质又被破坏了, 这时,可以将 GPUN 看成一个新的红色 N 节点, 如此递归调整下去; 特殊的, 如果碰巧将根节点染成了红色, 可以在算法的最后强制 root->黑.

    第 2 种情况, P 为红, N 为 P 右孩子, N 为红, U 为黑或缺少. 策略: 旋转变换, 从而进入下一种情况:(分N在P的左边还是右边)

    第 3 种情况, 可能由第二种变化而来, 但不是一定: P 为红, N 为 P 左孩子, N 为红. 策略: 旋转, 交换 P,G 颜色, 调整后, 因为 P 为黑色, 所以不怕 P 的父节点是红色的情况. over

    红黑树的插入就为上面的三种情况. 你可以做镜像变换从而得到其他的情况.


    从代码实现的角度分析:

    要真正理解红黑树的插入,还得先理解二叉查找树的插入。磨刀不误砍柴工,咱们再来了解一下二叉查找树的插入和红黑树的插入。如果要在二叉查找树中插入一个结点,首先要查找到结点要插入的位置,然后进行插入。假设插入的结点为z的话,插入的伪代码如下:

    tree_insert(T, z)
    	y = NULL
    	x = T
    	while(x != NULL)
    		y = x
    		if(z->key < x->key)
    			x = x->left
    		else 
    			x = x->right
    	end while
    	
    	z->parent = y;
    	
    	if(y == NULL)
    		T = z
    	else if(z->key < y->key)
    		y->left = z
    	else 
    		y->right = z
    

    红黑树的插入和插入修复

    现在我们了解了二叉查找树的插入,接下来,咱们便来具体了解下红黑树的插入操作。红黑树的插入相当于在二叉查找树插入的基础上,为了重新恢复平衡,继续做了插入修复操作。

    假设插入的结点为z,红黑树的插入伪代码具体如下所示:

    rb_tree_insert
    	y = NULL
    	x = T
    	while(x != NIL)
    		if(x->key < z->key)
    			x = x->right
    		else
    			x = x->left
    	end while
    	
    	z->parent = y
    	
    	if(y == NULL)
    		T = z
    	else if(z->key < x->key)
    		y->left = z
    	else
    		y->right = z
    	
    	z->left = NIL
    	z->right = NIL
    	z->color = RED
    	rb_tree_insert_fix(T, z)
    	
    end rb_tree_insert
    

    把上面这段红黑树的插入代码,跟之前看到的二叉查找树的插入代码比较一下可以看出,RB-INSERT(T, z)前面的第1~13行代码基本上就是二叉查找树的插入代码,然后第14~16行代码把z的左孩子和右孩子都赋为叶结点nil,再把z结点着为红色,最后为保证红黑性质在插入操作后依然保持,调用一个辅助程rb_tree_insert_fix来对结点进行重新着色,并旋转。


     下面紧接着调整程序:

    换言之,如果插入的是根结点,由于原树是空树,此情况只会违反rb_tree根节点是黑色的这一个性质,因此直接把此结点涂为黑色;如果插入的结点的父结点是黑色,由于此不会违反rb_tree性质,红黑树没有被破坏,所以此时什么也不做。

    但当遇到下述3种情况时又该如何调整呢?

    ● 插入修复情况1:如果当前结点的父结点是红色且祖父结点的另一个子结点(叔叔结点)是红色

    ● 插入修复情况2:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的右子

    ● 插入修复情况3:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的左子

    答案就是根据红黑树插入代码RB-INSERT(T, z)最后一行调用的RB-INSERT-FIX(T, z)函数所示的步骤进行操作,具体如下所示:

    //循环递归调整
    rb_tree_insert_fix(T, z)
    while(z->parent->color == RED)
    	if(z->parent == z->parent->parent->left)//父节点是祖父节点的左孩子
    		y = z->parent->parent->right//y是z的叔叔
    		if(y->color == RED)//红色叔叔
    			z->parent->color = BLACK
    			y->color = BLACK
    			z->parent->parent->color = RED
    			z = z->parent->parent
    		else if(z = z->parent->right)//黑色叔叔
    			z = z->parent
    			L_rotate(T, z)
    		else
    			z->parent->color = BLACK//这里会退出while循环
    			z->parent->parent->color = RED
    			R_Rotate(T, z->parent->parent)
    	else
    		//把rb_tree做对称处理
    end while
    T->color = BLACK
    end rb_tree_insert_fix
    

    下面,咱们来分别处理上述3种插入修复情况。

    插入修复情况1:当前结点的父结点是红色,祖父结点的另一个子结点(叔叔结点)是红色(这时的祖父节点一定是黑色的)。

    此时父结点的父结点一定存在,否则插入前就已不是红黑树。与此同时,又分为父结点是祖父结点的左孩子还是右孩子,根据对称性,我们只要解开一个方向就可以了。这里只考虑父结点为祖父左孩子的情况,如下图所示。

    对此,我们的解决策略是:将当前节点的父节点和叔叔节点涂黑,祖父结点涂红,把当前结点指向祖父节点,从新的当前节点重新开始算法。即如下代码所示:

    如下代码:

    //循环递归调整
    while(z->parent->color == RED)
    	if(z->parent == z->parent->parent->left)//父节点是祖父节点的左孩子
    		y = z->parent->parent->right//y是z的叔叔
    		if(y->color == RED)//红色叔叔
    			z->parent->color = BLACK
    			y->color = BLACK
    			z->parent->parent->color = RED
    			z = z->parent->parent
    			
    		
    		
    

    所以,变化后如下图所示:

    于是,插入修复情况1转换成了插入修复情况2。

    插入修复情况2:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的右子

    此时,解决对策是:当前节点的父节点做为新的当前节点,以新当前节点为支点左旋。即如下代码所示:

    else if(z = z->parent->right)//黑色叔叔
    	z = z->parent
    	L_rotate(T, z)
    

    所以红黑树由之前的:

    变化成:

    从而插入修复情况2转换成了插入修复情况3。

    插入修复情况3:当前节点的父节点是红色,叔叔节点是黑色,当前节点是其父节点的左孩子

    解决对策是:父节点变为黑色,祖父节点变为红色,在祖父节点为支点右旋,操作代码为:

    z->parent->color = BLACK
    z->parent->parent->color = RED
    R_Rotate(T, z->parent->parent)
    

    最后,把根结点涂为黑色,整棵红黑树便重新恢复了平衡。所以红黑树由之前的:

    变化成:

    总结:经过上面情况1、情况2、情况3等三种插入修复情况的操作示意图,读者自会发现,后面的情况2、情况3都是针对情况1插入节点4以后,进行的一系列插入修复情况操作,不过,指向当前节点N指针一直在变化。
    所以,你可以想当然的认为:整个下来,情况1、2、3就是一个完整的插入修复情况的操作流程。

  • 相关阅读:
    django 自定义用户身份验证
    登录验证算法
    Scrapy
    爬虫性能相关
    Beautifulsoup模块
    selenium模块
    Cookie&Session
    Django Admin 本质
    JavaScript自执行函数和jquery扩展方法
    JS作用域与词法分析
  • 原文地址:https://www.cnblogs.com/stemon/p/4860625.html
Copyright © 2020-2023  润新知