红黑树原理浅谈(附Linux内核源码注释)

本文转自https://blog.csdn.net/SL_World/article/details/84584503

引言:红黑树(英语:Red–black tree)是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典
型的用途是实现关联数组。它是在1972年由鲁道夫·贝尔发明的,他称之为"对称二叉B树",它现代的名字是在Leo
 J. Guibas和Robert Sedgewick于1978年写的一篇论文中获得的。它是复杂的,但它的操作有着良好的最坏情
况运行时间,并且在实践中是高效的:它可以在 O(log n) 时间内做查找,插入和删除,这里的n是树中元素的数
目。——摘自维基百科

红黑树的性质:

红黑树是每个节点都带有颜色属性的二叉查找树,颜色为红色黑色。在二叉查找树强制一般要求以外,对于任何有效的红黑树有如下的额外要求:

1.节点是红色或黑色。
2.根是黑色。
3.所有叶子都是黑色(叶子是NIL节点)。
4.每个红色节点必须有两个黑色的子节点。(从每个叶子到根的所有路径上不能有两个连续的红色节点。)
5.从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点。

红黑树原理浅谈(附Linux内核源码注释)_第1张图片

操作:
因为每一个红黑树也是一个特化的二叉查找树,因此红黑树上的只读操作与普通二叉查找树上的只读操作相同。然而,在红黑树上进行插入操作和删除操作会导致不再匹配红黑树的性质。恢复红黑树的性质需要少量 O(log n)的颜色变更(实际是非常快速的)和不超过三次树旋转(对于插入操作是两次)。虽然插入和删除很复杂,但操作时间仍可以保持为 O(log n)次。

红黑树的应用
它的统计性能要好于平衡二叉树(AVL树),因此,红黑树在很多地方都有应用。比如
①JDK1.8中的TreeMap 或
②C++的STL中的set和map函数或
③Linux内核中的rbtree.h和rbtree.c
都有红黑树的应用,这些集合均提供了很好的性能。

什么时候用AVL树?什么时候用红黑树?
首先AVL树和红黑树都是基于BST树(二叉搜索树),对于只读操作均和BST树相同,但BST树连续插入顺序递增或递减结点时会导致BST树退化成链表,性能大幅度降低。BST顺序插入如图:
红黑树原理浅谈(附Linux内核源码注释)_第2张图片

因此,AVL树和红黑树均在BST树的基础上进行了进一步的优化。以增加旋转操作(增加算法复杂度)来提升对于最坏情况下的性能。提升复杂度往往从两方面入手:
①提升数据结构的复杂度
②提升算法的复杂度
其中,红黑树为了降低原有算法复杂度,就以提升数据结构复杂度来间接减轻其算法复杂度。即在其结点中增加颜色属性,颜色只能有红色和黑色。在红黑树中只要任意结点左右孩子的黑色高度平衡(两边任意路径黑色结点数量相同)即可且对于有些情况可以通过变色来代替旋转从而减少一定的空间开销。

①AVL树采用平衡因子的绝对值<2来保证平衡,这种平衡是高度平衡的。要保证这种平衡需要更复杂的操作来维持。
②红黑树采用同一结点到叶结点的任意路径黑色结点数量相同来保证平衡,这种平衡只能保证从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。保证这种平衡只需要较少的操作来维持。

下图是从根到叶子的最长的可能路径=最短的可能路径的两倍长的情况:
红黑树原理浅谈(附Linux内核源码注释)_第3张图片

综上所述:删除结点最坏情况下,AVL树需要旋转的量级是O(log n),而红黑树最多只需3次旋转,只需要O(1)的复杂度。

下图是知乎大神提供的性能测试

红黑树原理浅谈(附Linux内核源码注释)_第4张图片

由此可见:

①红黑树由于插入删除时较少的旋转操作,对于需要频繁进行插入删除的场景性能比AVL树好
②反之,对于不需要频繁插入删除的场景。由于AVL树的高度平衡,使得同等结点数量下,AVL树的高度比红黑树更低,使得AVL树的查找性能比红黑树好。

JDK1.8里的TreeMapEntry对红黑树数据结构的定义

 /**
     * Node in the Tree.  Doubles as a means to pass key-value pairs back to
     * user (see Map.Entry).
     */
 
    static final class TreeMapEntry implements Map.Entry {
        K key;
        V value;
        TreeMapEntry left = null;//左子树
        TreeMapEntry right = null;//右子树
        TreeMapEntry parent;//父节点
        boolean color = BLACK;//默认为黑色
 
        /**
         * Make a new cell with given key, value, and parent, and with
         * {@code null} child links, and BLACK color.
         */
        TreeMapEntry(K key, V value, TreeMapEntry parent) {
            this.key = key;
            this.value = value;
            this.parent = parent;
        }
 
        /**
         * Returns the key.
         *
         * @return the key
         */
        public K getKey() {
            return key;
        }
 
        /**
         * Returns the value associated with the key.
         *
         * @return the value associated with the key
         */
        public V getValue() {
            return value;
        }
        /*...各种方法*/

Linux内核文件rbtree.h中对红黑树的数据结构的定义

struct rb_node
 {/*long是四个字节,占用共4x8=32bit,其中有两位存储父结点指针+自己的颜色值*/
     unsigned long  rb_parent_color; /*注意:此处保存的是父指针+自己颜色*/
 #define    RB_RED      0
 #define    RB_BLACK    1
     struct rb_node *rb_right;
     struct rb_node *rb_left;
 } /*  __attribute__((aligned(sizeof(long))))*/;
     /* The alignment might seem pointless, but allegedly CRIS needs it */
 
 struct rb_root
 {
     struct rb_node *rb_node;
 };

以及rbtree.h中在插入新结点时,初始化红黑树结点操作

static inline void rb_init_node(struct rb_node *rb)
 {
     rb->rb_parent_color = 0;
     rb->rb_right = NULL;
     rb->rb_left = NULL;
     RB_CLEAR_NODE(rb);
 }

在此需要先了解左旋和右旋的原理

结点E左旋操作:

红黑树原理浅谈(附Linux内核源码注释)_第5张图片

代码如下:

/*
 * 左旋操作Linux c代码(来源于Linux内核rbtree.c)
*/
static void __rb_rotate_left(struct rb_node *node, struct rb_root *root)
{
    struct rb_node *right = node->rb_right;
    struct rb_node *parent = rb_parent(node);

    if ((node->rb_right = right->rb_left))  //node的右指针指向node右孩子的左孩子
        rb_set_parent(right->rb_left, node);//node右孩子的左孩子的父亲指定为node
    right->rb_left = node;

    rb_set_parent(right, parent); //node右孩子祖父指定为node原父亲

    if (parent) //node原父亲存在,即原node不是根结点
    {
        if (node == parent->rb_left)
            parent->rb_left = right;
        else
            parent->rb_right = right;
    }
    else //原node是根结点
        root->rb_node = right;
    rb_set_parent(node, right); //node现任父亲指定为node原右孩子
}

结点S右旋操作:

红黑树原理浅谈(附Linux内核源码注释)_第6张图片

static void __rb_rotate_right(struct rb_node *node, struct rb_root *root)
{
    struct rb_node *left = node->rb_left;
    struct rb_node *parent = rb_parent(node);

    if ((node->rb_left = left->rb_right))
        rb_set_parent(left->rb_right, node);
    left->rb_right = node;

    rb_set_parent(left, parent);

    if (parent)
    {
        if (node == parent->rb_right)
            parent->rb_right = left;
        else
            parent->rb_left = left;
    }
    else
        root->rb_node = left;
    rb_set_parent(node, left);
}

红黑树插入操作逻辑:

红黑树原理浅谈(附Linux内核源码注释)_第7张图片

 

红黑树删除操作逻辑:

红黑树原理浅谈(附Linux内核源码注释)_第8张图片

 

Linux内核源码注释解析

rbtree.c

/*
  Red Black Trees
  (C) 1999  Andrea Arcangeli 
  (C) 2002  David Woodhouse 

  This program is free software; you can redistribute it and/or modify
  it under the terms of the GNU General Public License as published by
  the Free Software Foundation; either version 2 of the License, or
  (at your option) any later version.

  This program is distributed in the hope that it will be useful,
  but WITHOUT ANY WARRANTY; without even the implied warranty of
  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  GNU General Public License for more details.

  You should have received a copy of the GNU General Public License
  along with this program; if not, write to the Free Software
  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA

  linux/lib/rbtree.c
*/

#include "rbtree.h"
/*
 * 左旋操作
*/
static void __rb_rotate_left(struct rb_node *node, struct rb_root *root)
{
    struct rb_node *right = node->rb_right;
    struct rb_node *parent = rb_parent(node);

    if ((node->rb_right = right->rb_left))  //node的右指针指向node右孩子的左孩子
        rb_set_parent(right->rb_left, node);//node右孩子的左孩子的父亲指定为node
    right->rb_left = node;

    rb_set_parent(right, parent); //node右孩子祖父指定为node原父亲

    if (parent) //node原父亲存在,即原node不是根结点
    {
        if (node == parent->rb_left)
            parent->rb_left = right;
        else
            parent->rb_right = right;
    }
    else //原node是根结点
        root->rb_node = right;
    rb_set_parent(node, right); //node现任父亲指定为node原右孩子
}
/*
 * 右旋操作
*/
static void __rb_rotate_right(struct rb_node *node, struct rb_root *root)
{
    struct rb_node *left = node->rb_left;
    struct rb_node *parent = rb_parent(node);

    if ((node->rb_left = left->rb_right))
        rb_set_parent(left->rb_right, node);
    left->rb_right = node;

    rb_set_parent(left, parent);

    if (parent)
    {
        if (node == parent->rb_right)
            parent->rb_right = left;
        else
            parent->rb_left = left;
    }
    else
        root->rb_node = left;
    rb_set_parent(node, left);
}
/*
 * 插入结点操作
*/
void rb_insert_color(struct rb_node *node, struct rb_root *root)
{
    struct rb_node *parent, *gparent;
    //情况1,2:node不是根结点,即有父结点P且P是红色的
    while ((parent = rb_parent(node)) && rb_is_red(parent))
    {
        gparent = rb_parent(parent);
        //P是祖父G的左孩子
        if (parent == gparent->rb_left)
        {
            {
                register struct rb_node *uncle = gparent->rb_right;
                if (uncle && rb_is_red(uncle)) //情况3:node的叔父结点是红色的
                {
                    rb_set_black(uncle);
                    rb_set_black(parent);
                    rb_set_red(gparent);
                    node = gparent;
                    continue;
                }
            }
            //情况4:node和父结点P是LR型(变成LL型)
            if (parent->rb_right == node)
            {
                register struct rb_node *tmp;
                __rb_rotate_left(parent, root);
                tmp = parent;
                parent = node;
                node = tmp;
            }
            //情况5:node和父结点P是LL型
            rb_set_black(parent);
            rb_set_red(gparent);
            __rb_rotate_right(gparent, root);
        } else {  //P是祖父G的右孩子,与上述情况对调
            {
                register struct rb_node *uncle = gparent->rb_left;
                if (uncle && rb_is_red(uncle))
                {
                    rb_set_black(uncle);
                    rb_set_black(parent);
                    rb_set_red(gparent);
                    node = gparent;
                    continue;
                }
            }

            if (parent->rb_left == node)
            {
                register struct rb_node *tmp;
                __rb_rotate_right(parent, root);
                tmp = parent;
                parent = node;
                node = tmp;
            }

            rb_set_black(parent);
            rb_set_red(gparent);
            __rb_rotate_left(gparent, root);
        }
    }
    //若node是根结点||node的父结点P是黑色的,则把根结点->黑色
    rb_set_black(root->rb_node);
}
/*
 * 删除结点操作(Node和Child均是黑色的情况)
*/
static void __rb_erase_color(struct rb_node *node, struct rb_node *parent,
                 struct rb_root *root)
{
    struct rb_node *other;
    //以下循环体条件node不是根结点&&(node非空||node是黑色的)
    while ((!node || rb_is_black(node)) && node != root->rb_node)
    {
        if (parent->rb_left == node) //若node是父结点的左孩子
        {
            other = parent->rb_right;
            if (rb_is_red(other))    //N的兄弟结点S是红色的
            {   //S由红色->黑色;P由黑色->红色;P左旋
                rb_set_black(other);
                rb_set_red(parent);
                __rb_rotate_left(parent, root);
                other = parent->rb_right;
            }   //SL黑色&&SR黑色
            if ((!other->rb_left || rb_is_black(other->rb_left)) &&
                (!other->rb_right || rb_is_black(other->rb_right)))
            {
                rb_set_red(other);
                node = parent;  //将P作为node带入以下检查程序
                parent = rb_parent(node);
            }
            else
            {    //SL是红色(推断),SR是黑色
                if (!other->rb_right || rb_is_black(other->rb_right))
                { //SL由红色->黑色;S由黑色->红色;右旋S;P的新右孩子是SL
                    rb_set_black(other->rb_left);
                    rb_set_red(other);
                    __rb_rotate_right(other, root);
                    other = parent->rb_right;
                } //S由黑色->P的颜色;P->黑色;SR由红色->黑色;左旋P
                rb_set_color(other, rb_color(parent));
                rb_set_black(parent);
                rb_set_black(other->rb_right);
                __rb_rotate_left(parent, root);
                node = root->rb_node;
                break;
            }
        }
        else  //若node是父结点的右孩子,和上述情况对调
        {
            other = parent->rb_left;
            if (rb_is_red(other))
            {
                rb_set_black(other);
                rb_set_red(parent);
                __rb_rotate_right(parent, root);
                other = parent->rb_left;
            }
            if ((!other->rb_left || rb_is_black(other->rb_left)) &&
                (!other->rb_right || rb_is_black(other->rb_right)))
            {
                rb_set_red(other);
                node = parent;
                parent = rb_parent(node);
            }
            else
            {
                if (!other->rb_left || rb_is_black(other->rb_left))
                {
                    rb_set_black(other->rb_right);
                    rb_set_red(other);
                    __rb_rotate_left(other, root);
                    other = parent->rb_left;
                }
                rb_set_color(other, rb_color(parent));
                rb_set_black(parent);
                rb_set_black(other->rb_left);
                __rb_rotate_right(parent, root);
                node = root->rb_node;
                break;
            }
        }
    }
    if (node)
        rb_set_black(node);
}
/*
 * 删除红黑树结点,处理除Node和Child均是黑色以外的情况,最后单独将这种情况用__rb_erase_color函数处理
*/
void rb_erase(struct rb_node *node, struct rb_root *root)
{
    struct rb_node *child, *parent;
    int color;

    if (!node->rb_left)      //1.删除节点node左孩子为空
        child = node->rb_right; //child为node右孩子
    else if (!node->rb_right)//2.删除节点node右孩子为空
        child = node->rb_left;  //child为node左孩子
    else  //3.删除节点node子结点均非空,则需要找到其右子树的最小的结点然后跟换两个结点的值
    {
        struct rb_node *old = node, *left;

        node = node->rb_right; //令node为原node的右孩子
        while ((left = node->rb_left) != NULL) //不断循环找到其最左的孩子(最小值结点)
            node = left;

        if (rb_parent(old)) {  //若原node(old)有父结点
            if (rb_parent(old)->rb_left == old) //若old是父结点的左孩子,则现在左孩子是新node
                rb_parent(old)->rb_left = node;
            else
                rb_parent(old)->rb_right = node;//若old是父结点的右孩子,则现在右孩子是新node
        } else
            root->rb_node = node; //若原node(old)是根结点,则现在的根是新node

        child = node->rb_right; //新node的右孩子的是child
        parent = rb_parent(node);//新node的父亲的是parent
        color = rb_color(node);//新node的颜色是color
        //以下将old替换为新node结点,同时将新node的非空子结点child成为P的左孩子
        if (parent == old) {
            parent = node;
        } else {
            if (child)
                rb_set_parent(child, parent);
            parent->rb_left = child;  //P的左孩子由node变为child

            node->rb_right = old->rb_right;
            rb_set_parent(old->rb_right, node);
        }

        node->rb_parent_color = old->rb_parent_color;  //Linux内核中红黑树数据结构存储的是其父结点的颜色
        node->rb_left = old->rb_left;
        rb_set_parent(old->rb_left, node);

        goto color;  //goto到"color:"一行
    }
    //以下步骤是对换情况1和2的node和child两结点,使child为node的新父亲
    parent = rb_parent(node);
    color = rb_color(node);

    if (child)
        rb_set_parent(child, parent);
    if (parent)
    {
        if (parent->rb_left == node)
            parent->rb_left = child;
        else
            parent->rb_right = child;
    }
    else
        root->rb_node = child;
    //以上步骤是对换情况1和2的node和child两结点,使child为node的新父亲
 color:
    if (color == RB_BLACK) //若和child颠倒位置后的node结点是黑色
        __rb_erase_color(child, parent, root); //将child带入检查程序
}
/*
 * 替换结点函数(将结点victim替换为结点new)
*/
void rb_replace_node(struct rb_node *victim, struct rb_node *new,
             struct rb_root *root)
{
    struct rb_node *parent = rb_parent(victim);

    /* Set the surrounding nodes to point to the replacement */
    if (parent) {
        if (victim == parent->rb_left)
            parent->rb_left = new;
        else
            parent->rb_right = new;
    } else {
        root->rb_node = new;
    }
    if (victim->rb_left)
        rb_set_parent(victim->rb_left, new);
    if (victim->rb_right)
        rb_set_parent(victim->rb_right, new);

    /* Copy the pointers/colour from the victim to the replacement */
    *new = *victim;
}
/*...后续扩展函数等*/

 

你可能感兴趣的:(C/C++编程,Linux,kernel,linux,kernel,学习)