目录
1. 红黑树
1.1 红黑树的概念
1.2 红黑树的性质
1.3 红黑树节点的定义
1.4 红黑树结构
1.5 红黑树的插入操作
1.6 红黑树的验证
1.7 红黑树的删除
1.8 红黑树与AVL树的比较
1.9 红黑树的应用
2 .红黑树模拟实现STL中的map与set
2.1 红黑树的迭代器
2.2 改造红黑树
3.红黑树的模拟实现:
3.1功能函数:
(1)定义红黑树的结构:
(2) Insert:
(3)左旋RotateL:
(4)右旋RotateR:
(5)求最长路径:
(6)求最短路径:
(7)遍历(递归版):
(8)判断是否为有效红黑树:
(9)判断是否满足红黑树的性质:
(10)层序遍历:
3.2 完整源码:
(1)RBTree.h:
(2)test.cpp:
(3)测试用例:
后记:●由于作者水平有限,文章难免存在谬误之处,敬请读者斧正,俚语成篇,恳望指教!
——By 作者:新晓·故知
红黑树,是一种二叉搜索树,但在每个结点上增加一个存储位表示结点的颜色,可以是Red或 Black。 通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出两倍,因而是接近平衡的。图片源于网络:(这里仅做学习用途,如有侵权,请联系删除!)
1. 每个结点不是红色就是黑色2. 根节点是黑色的3. 如果一个节点是红色的,则它的两个孩子结点是黑色的 (即没有连续的红色结点)4. 对于每个结点,从该结点到其所有后代叶结点的简单路径上,均包含相同数目的黑色结点 (即每条路径都包含相同数量得黑色结点)5. 每个叶子结点都是黑色的(此处的叶子结点指的是空结点)思考:为什么满足上面的性质,红黑树就能保证:其最长路径中节点个数不会超过最短路径节点个数的两倍?解析:(极限分析)
- 当为最短路径时,则是所有结点均为黑色的满二叉树
- 当为最长路径时,则结点是一黑一红间隔的二叉树
// 节点的颜色 enum Color { RED, BLACK }; // 红黑树节点的定义 template
struct RBTreeNode { RBTreeNode(const ValueType& data = ValueType(),Color color = RED) : _pLeft(nullptr), _pRight(nullptr), _pParent(nullptr) , _data(data), _color(color) {} RBTreeNode * _pLeft; // 节点的左孩子 RBTreeNode * _pRight; // 节点的右孩子 RBTreeNode * _pParent; // 节点的双亲(红黑树需要旋转,为了实现简单给 出该字段) ValueType _data; // 节点的值域 Color _color; // 节点的颜色 }; 思考:在节点的定义中,为什么要将节点的默认颜色给成红色的?
为了后续实现关联式容器简单,红黑树的实现中增加一个头结点,因为跟节点必须为黑色,为了与根节点进行区分,将头结点给成黑色,并且让头结点的 pParent 域指向红黑树的根节点,pLeft 域指向红黑树中最小的节点,_pRight域指向红黑树中最大的节点,如下:
红黑树是在二叉搜索树的基础上加上其平衡限制条件,因此红黑树的插入可分为两步:1. 按照二叉搜索的树规则插入新节点template
class RBTree { //…… bool Insert(const ValueType& data) { PNode& pRoot = GetRoot(); if (nullptr == pRoot) { pRoot = new Node(data, BLACK); // 根的双亲为头节点 pRoot->_pParent = _pHead; _pHead->_pParent = pRoot; } else { // 1. 按照二叉搜索的树方式插入新节点 // 2. 检测新节点插入后,红黑树的性质是否造到破坏, // 若满足直接退出,否则对红黑树进行旋转着色处理 } // 根节点的颜色可能被修改,将其改回黑色 pRoot->_color = BLACK; _pHead->_pLeft = LeftMost(); _pHead->_pRight = RightMost(); return true; } private: PNode& GetRoot() { return _pHead->_pParent; } // 获取红黑树中最小节点,即最左侧节点 PNode LeftMost(); // 获取红黑树中最大节点,即最右侧节点 PNode RightMost(); private: PNode _pHead; }; 2. 检测新节点插入后,红黑树的性质是否造到破坏因为新节点的默认颜色是红色,因此:如果其双亲节点的颜色是黑色,没有违反红黑树任何性质,则不需要调整;但当新插入节点的双亲节点颜色为红色时,就违反了性质三不能有连在一起的红色节点,此时需要对红黑树分情况来讨论:约定:cur为当前节点,p为父节点,g为祖父节点,u为叔叔节点cur和p均为红,违反了性质三,此处能否将p直接改为黑?解决方式:将p,u改为黑,g改为红,然后把g当成cur,继续向上调整。
p为g的左孩子,cur为p的左孩子,则进行右单旋转;相反,p为g的右孩子,cur为p的右孩子,则进行左单旋转p、g变色--p变黑,g变红p为g的左孩子,cur为p的右孩子,则针对p做左单旋转;相反,p为g的右孩子,cur为p的左孩子,则针对p做右单旋转针对每种情况进行相应的处理即可。
bool Insert(const ValueType& data) { // ... // 新节点插入后,如果其双亲节点的颜色为空色,则违反性质3:不能有连在一起的红色结 点 while(pParent && RED == pParent->_color) { // 注意:grandFather一定存在 // 因为pParent存在,且不是黑色节点,则pParent一定不是根,则其一定有双亲 PNode grandFather = pParent->_pParent; // 先讨论左侧情况 if (pParent == grandFather->_pLeft) { PNode unclue = grandFather->_pRight; // 情况三:叔叔节点存在,且为红 if (unclue && RED == unclue->_color) { pParent->_color = BLACK; unclue->_color = BLACK; grandFather->_color = RED; pCur = grandFather; pParent = pCur->_pParent; } else { // 情况五:叔叔节点不存在,或者叔叔节点存在且为黑 if (pCur == pParent->_pRight) { _RotateLeft(pParent); swap(pParent, pCur); } // 情况五最后转化成情况四 grandFather->_color = RED; pParent->_color = BLACK; _RotateRight(grandFather); } } else { // 右侧请学生们自己动手完成 } } // ... }
红黑树的检测分为两步:1. 检测其是否满足二叉搜索树(中序遍历是否为有序序列)2. 检测其是否满足红黑树的性质
bool IsValidRBTree() { PNode pRoot = GetRoot(); // 空树也是红黑树 if (nullptr == pRoot) return true; // 检测根节点是否满足情况 if (BLACK != pRoot->_color) { cout << "违反红黑树性质二:根节点必须为黑色" << endl; return false; } // 获取任意一条路径中黑色节点的个数 size_t blackCount = 0; PNode pCur = pRoot; while (pCur) { if (BLACK == pCur->_color) blackCount++; pCur = pCur->_pLeft; } // 检测是否满足红黑树的性质,k用来记录路径中黑色节点的个数 size_t k = 0; return _IsValidRBTree(pRoot, k, blackCount); } bool _IsValidRBTree(PNode pRoot, size_t k, const size_t blackCount) { //走到null之后,判断k和black是否相等 if (nullptr == pRoot) { if (k != blackCount) { cout << "违反性质四:每条路径中黑色节点的个数必须相同" << endl; return false; } return true; } // 统计黑色节点的个数 if (BLACK == pRoot->_color) k++; // 检测当前节点与其双亲是否都为红色 PNode pParent = pRoot->_pParent; if (pParent && RED == pParent->_color && RED == pRoot->_color) { cout << "违反性质三:没有连在一起的红色节点" << endl; return false; } return _IsValidRBTree(pRoot->_pLeft, k, blackCount) && _IsValidRBTree(pRoot->_pRight, k, blackCount); }
红黑树的删除本节不做讲解,有兴趣的同学可参考:《算法导论》或者《STL源码剖析》
红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O($log_2 N$),红黑树不追求绝对平衡,其只需保证最长路径不超过最短路径的2倍,相对而言,降低了插入和旋转的次数,所以在经常进行增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。
1. C++ STL库 -- map/set、mutil_map/mutil_set2. Java 库3. linux内核4. 其他一些库
迭代器的好处是可以方便遍历,是数据结构的底层实现与用户透明。如果想要给红黑树增加迭代器,需要考虑以前问题:begin()与end()STL明确规定,begin()与end()代表的是一段前闭后开的区间,而对红黑树进行中序遍历后,可以得到一个有序的序列,因此:begin()可以放在红黑树中最小节点(即最左侧节点)的位置,end()放在最大节点(最右侧节点)的下一个位置,关键是最大节点的下一个位置在哪块?能否给成nullptr呢?答案是行不通的,因为对end()位置的迭代器进行--操作,必须要能找最后一个元素,此处就不行,因此最好的方式是将end()放在头结点的位置:图片源于网络:(这里仅做学习用途,如有侵权,请联系删除!)
- operator++()与operator--()
// 找迭代器的下一个节点,下一个节点肯定比其大 void Increasement() { //分两种情况讨论:_pNode的右子树存在和不存在 // 右子树存在 if (_pNode->_pRight) { // 右子树中最小的节点,即右子树中最左侧节点 _pNode = _pNode->_pRight; while (_pNode->_pLeft) _pNode = _pNode->_pLeft; } else { // 右子树不存在,向上查找,直到_pNode != pParent->right PNode pParent = _pNode->_pParent; while (pParent->_pRight == _pNode) { _pNode = pParent; pParent = _pNode->_pParent; } // 特殊情况:根节点没有右子树 if (_pNode->_pRight != pParent) _pNode = pParent; } } // 获取迭代器指向节点的前一个节点 void Decreasement() { //分三种情况讨论:_pNode 在head的位置,_pNode 左子树存在,_pNode 左子树不存在 // 1. _pNode 在head的位置,--应该将_pNode放在红黑树中最大节点的位置 if (_pNode->_pParent->_pParent == _pNode && _pNode->_color == RED) _pNode = _pNode->_pRight; else if (_pNode->_pLeft) { // 2. _pNode的左子树存在,在左子树中找最大的节点,即左子树中最右侧节点 _pNode = _pNode->_pLeft; while (_pNode->_pRight) _pNode = _pNode->_pRight; } else { // _pNode的左子树不存在,只能向上找 PNode pParent = _pNode->_pParent; while (_pNode == pParent->_pLeft) { _pNode = pParent; pParent = _pNode->_pParent; } _pNode = pParent; } }
// 因为关联式容器中存储的是
的键值对,因此 // k为key的类型, // ValueType: 如果是map,则为pair ; 如果是set,则为k // KeyOfValue: 通过value来获取key的一个仿函数类 template class RBTree { typedef RBTreeNode Node; typedef Node* PNode; public: typedef RBTreeIterator Iterator; public: RBTree(); ~RBTree() / // Iterator Iterator Begin() { return Iterator(_pHead->_pLeft); } Iterator End() { return Iterator(_pHead); } // // Modify pair Insert(const ValueType& data) { // 插入节点并进行调整 // 参考上文... return make_pair(Iterator(pNewNode), true); } // 将红黑树中的节点清空 void Clear(); Iterator Find(const K& key); // // capacity size_t Size()const; bool Empty()const; // …… private: PNode _pHead; size_t _size; // 红黑树中有效节点的个数 };
红黑树通过颜色分配控制结构,从而使得查找效率得以提升,因此也被广泛使用。同AVL树一样,这里对红黑树的实现也通过Insert数据,进行分析。在Insert数据过程中,会改变二叉树的结构,因此需要处理,以保证二叉树的结构满足要求,而红黑树的处理更为复杂,红黑树的Find、Erase操作可参考教材或其他资料。
(1)定义红黑树的结构:
(2) Insert:
(3)左旋RotateL:
(4)右旋RotateR: (5)求最长路径:
(6)求最短路径: (7)遍历(递归版):
(8)判断是否为有效红黑树: (9)判断是否满足红黑树的性质:
(10)层序遍历:
(1)RBTree.h:
#pragma once #include
#include #include #include using namespace std; enum Colour { RED, BLACK, }; template struct RBTreeNode { RBTreeNode * _left; RBTreeNode * _right; RBTreeNode * _parent; pair _kv; Colour _col; RBTreeNode(const pair & kv) :_kv(kv) , _left(nullptr) , _right(nullptr) , _parent(nullptr) , _col(RED) {} }; template struct RBTree { typedef RBTreeNode Node; public: bool Insert(const pair & kv) { // 1、搜索树的规则插入 // 2、看是否违反平衡规则,如果违反就需要处理:旋转 if (_root == nullptr) { _root = new Node(kv); _root->_col = BLACK; return true; } Node* parent = nullptr; Node* cur = _root; while (cur) { if (cur->_kv.first < kv.first) { parent = cur; cur = cur->_right; } else if (cur->_kv.first > kv.first) { parent = cur; cur = cur->_left; } else { return false; } } cur = new Node(kv); cur->_col = RED; //插入新结点为红色,影响最小 if (parent->_kv.first < kv.first) { parent->_right = cur; } else { parent->_left = cur; } cur->_parent = parent; // 存在连续红色节点 while (parent && parent->_col == RED) { Node* grandfater = parent->_parent; assert(grandfater); if (grandfater->_left == parent) { Node* uncle = grandfater->_right; // 情况一: if (uncle && uncle->_col == RED) // 叔叔存在且为红 { // 变色 parent->_col = uncle->_col = BLACK; grandfater->_col = RED; // 继续往上处理 cur = grandfater; parent = cur->_parent; } else // 叔叔不存在 或者 叔叔存在且为黑 { if (cur == parent->_left) // 单旋 { // g // p // c RotateR(grandfater); parent->_col = BLACK; grandfater->_col = RED; } else // 双旋 { // g // p // c RotateL(parent); RotateR(grandfater); cur->_col = BLACK; grandfater->_col = RED; } break; } } else //(grandfater->_right == parent) { Node* uncle = grandfater->_left; // 情况一: if (uncle && uncle->_col == RED) { // 变色 parent->_col = uncle->_col = BLACK; grandfater->_col = RED; // 继续往上处理 cur = grandfater; parent = cur->_parent; } else { if (cur == parent->_right) { // g // p // c RotateL(grandfater); parent->_col = BLACK; grandfater->_col = RED; } else // 双旋 { // g // p // c RotateR(parent); RotateL(grandfater); cur->_col = BLACK; grandfater->_col = RED; } break; } } } _root->_col = BLACK; return true; } //层序遍历 vector > levelOrder() { cout << "层序遍历:"< > vv; if (_root == nullptr) return vv; queue q; int levelSize = 1; q.push(_root); while (!q.empty()) { // levelSize控制一层一层出 vector levelV; while (levelSize--) { Node* front = q.front(); q.pop(); levelV.push_back(front->_kv.first); if (front->_left) q.push(front->_left); if (front->_right) q.push(front->_right); } vv.push_back(levelV); for (auto e : levelV) { cout << e << " "; } cout << endl; // 上一层出完,下一层就都进队列 levelSize = q.size(); } return vv; } //左旋 void RotateL(Node* parent) { Node* subR = parent->_right; Node* subRL = subR->_left; parent->_right = subRL; if (subRL) subRL->_parent = parent; Node* ppNode = parent->_parent; subR->_left = parent; parent->_parent = subR; if (parent == _root) { _root = subR; _root->_parent = nullptr; } else { if (parent == ppNode->_left) { ppNode->_left = subR; } else { ppNode->_right = subR; } subR->_parent = ppNode; } } //右旋 void RotateR(Node* parent) { Node* subL = parent->_left; Node* subLR = subL->_right; parent->_left = subLR; if (subLR) subLR->_parent = parent; Node* ppNode = parent->_parent; subL->_right = parent; parent->_parent = subL; if (parent == _root) { _root = subL; _root->_parent = nullptr; } else { if (ppNode->_left == parent) { ppNode->_left = subL; } else { ppNode->_right = subL; } subL->_parent = ppNode; } } //求最长路径 int _maxHeight(Node* root) { if (root == nullptr) return 0; int lh = _maxHeight(root->_left); int rh = _maxHeight(root->_right); return lh > rh ? lh + 1 : rh + 1; } //求最短路径 int _minHeight(Node* root) { if (root == nullptr) return 0; int lh = _minHeight(root->_left); int rh = _minHeight(root->_right); return lh < rh ? lh + 1 : rh + 1; } //1.中序遍历(递归版) void _InOrder(Node* root) { if (root == nullptr) return; _InOrder(root->_left); cout << root->_kv.first << " "; _InOrder(root->_right); } //2.前序遍历(递归版) void _PrevOrder(Node* root) { if (root == nullptr) return; cout << root->_kv.first << " "; _PrevOrder(root->_left); _PrevOrder(root->_right); } //3.后序遍历(递归版) void _PostOrder(Node* root) { if (root == nullptr) return; _PostOrder(root->_left); _PostOrder(root->_right); cout << root->_kv.first << " "; } //判断是否为有效红黑树 bool _IsValidRBTree(Node* pRoot, size_t k, const size_t blackCount) { //走到null之后,判断k和black是否相等 if (nullptr == pRoot) { if (k != blackCount) { cout << "违反性质四:每条路径中黑色节点的个数必须相同" << endl; return false; } return true; } // 统计黑色节点的个数 if (BLACK == pRoot->_col) k++; // 检测当前节点与其双亲是否都为红色 if (RED == pRoot->_col && pRoot->_parent && pRoot->_parent->_col == RED) { cout << "违反性质三:存在连在一起的红色节点" << endl; return false; } return _IsValidRBTree(pRoot->_left, k, blackCount) && _IsValidRBTree(pRoot->_right, k, blackCount); } public: //遍历 void InOrder() { cout << "中序遍历:"; _InOrder(_root); cout << endl; } void PrevOrder() { cout << "前序遍历:"; _PrevOrder(_root); cout << endl; } void PostOrder() { cout << "后序遍历:"; _PostOrder(_root); cout << endl; } void Height() { cout << "最长路径:" << _maxHeight(_root) << endl; cout << "最短路径:" << _minHeight(_root) << endl; } bool IsBalanceTree() { // 检查红黑树几条规则 Node* pRoot = _root; // 空树也是红黑树 if (nullptr == pRoot) return true; // 检测根节点是否满足情况 if (BLACK != pRoot->_col) { cout << "违反红黑树性质二:根节点必须为黑色" << endl; return false; } // 获取任意一条路径中黑色节点的个数 -- 比较基准值 size_t blackCount = 0; Node* pCur = pRoot; while (pCur) { if (BLACK == pCur->_col) blackCount++; pCur = pCur->_left; } // 检测是否满足红黑树的性质,k用来记录路径中黑色节点的个数 size_t k = 0; return _IsValidRBTree(pRoot, k, blackCount); } private: Node* _root = nullptr; }; (2)test.cpp:
#include"RBTree.h" void TestRBTree1() { //int a[] = { 1, 2, 3, 4, 5, 6, 7, 8 }; int a[] = { 30, 29, 28, 27, 26, 25, 24, 11, 8, 7, 6, 5, 4, 3, 2, 1 }; RBTree
t; for (auto e : a) { t.Insert(make_pair(e, e)); } t.levelOrder(); cout << endl; t.InOrder(); t.PrevOrder(); t.PostOrder(); cout << endl; t.Height(); } void TestRBTree2() { //const size_t N = 1024 * 1024; const size_t N = 50; vector v; v.reserve(N); srand(time(0)); for (size_t i = 0; i < N; ++i) { //v.push_back(rand()); v.push_back(i); } RBTree t; for (auto e : v) { t.Insert(make_pair(e, e)); } t.levelOrder(); cout << endl; cout << "树是否平衡?(1:是 0:不是):" << t.IsBalanceTree() << endl; t.Height(); t.InOrder(); } int main() { TestRBTree1(); //TestRBTree2(); return 0; } (3)测试用例: