数据结构(高阶)—— 红黑树

目录

一、红黑树的概念

二、红黑树的性质

三、红黑树的结点定义

四、红黑树的插入

五、红黑树的验证

六、红黑树与AVL树的比较


一、红黑树的概念

        红黑树,是一种二叉搜索树,但在每个结点上增加了一个存储位表示结点的颜色,可以使Red或Black。通过对任何一条从根到叶子的路劲上各个结点着色的限制,红黑树确保没有一条路径会比其他路径长出两倍,因而近似平衡的。

数据结构(高阶)—— 红黑树_第1张图片

二、红黑树的性质

红黑树有以下五点性质:

  1. 每个结点不是红色就是黑色。
  2. 根结点是黑色的。
  3. 如果一个结点是红色的,则它的两个孩子结点是黑色的。(没有连续的红结点)
  4. 对于每个结点,从该结点到其所有后代叶子结点的简单路径上,均包含相同数目的黑色结点。(每条路径上的黑色结点数量相同)
  5. 每个叶子结点都是黑色的(此处的叶子结点指定是空结点)。

        为什么满足上面的性质,红黑树就能保证:其最长路径中节点个数不会超过最短路径节点给树的两倍呢?

数据结构(高阶)—— 红黑树_第2张图片

        1. 根据性质3和性质4,我们知道不能有连续的红节点,但是连续的黑节点是可以的,当某个路径中的节点全为黑时,就是该树的最短路径

        2. 根据性质1和性质4,我们知道最长路径是由一个黑节点和一个红节点交替组成;

        3. 并且最后的叶子节点均是黑色结点(图上为标注);

这样一来就能够保证最长路径中节点个数不会超过最短路径节点给树的两倍

三、红黑树的结点定义

        对于红黑树的结点定义,我们依旧使用三叉链来实现,因为红黑树本质也是一种二叉搜索树,相比AVL树的节点定义,我们不再使用平衡因子来控制这里的平衡,而是通过控制颜色来控制平衡。

//节点的颜色
enum Colour
{
	RED,
	BLACK
};

//红黑树节点的定义
template
struct RBTreeNode
{
    //三叉链
	RBTreeNode* _left;   //节点的左孩子
	RBTreeNode* _right;  //节点的右孩子
	RBTreeNode* _parent; //节点的父亲

	pair _kv;//存储键值对

	Colour _col;//利用枚举记录红黑结点

    //构造函数
	RBTreeNode(const pair& kv)
		:_left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _kv(kv)
		, _col(RED)
	{}
};

        对于红黑树的插入来说,我们都是要通过构造红黑树节点来进行插入的,那么就有一个问题,究竟是构造红节点还是黑节点呢?

数据结构(高阶)—— 红黑树_第3张图片

        对于左图的红黑树,插入的是黑色节点,破坏了性质4,就需要对红黑树进行调整,这里很显然插入一个黑色节点影响了所有路径;

        对于右图的红黑树,插入的是红色节点,破坏了性质3,但是性质4是具备的,这里显然只是局部发生的影响,并没有影响整棵红黑树;

        以上图为例,当插入的是红节点时,其父节点如果是黑色,那么将不需要调整红黑树;如果是红色节点也只是影响局部,简单调整;但是插入黑色节点就不一样了,无论你插在哪里,对整棵树的影响很大;此时两种节点的插入,所带来的性价比就很显然易见了;

        权衡利弊下:插入红节点最佳。所以我们在构造结点进行插入时,默认将结点的颜色设置为红色。

四、红黑树的插入

红黑树的插入分为以下两个步骤:

  1. 按照二叉搜索树的插入方法,找到并插入。
  2. 若插入节点的父节点是红色,则需要对红黑树进行调整。

        当插入节点的父节点为黑色时,我们是不需要对红黑树进行调整的,因为并没有破坏红黑树的5个性质;但是其父节点是红色时,就需要分为四种情况进行调整。

        首先规定如下:cur为当前(新增)节点、p为父节点、g为祖父节点、u为叔叔节点

cur —— current;p —— parent;g —— grandfather;u —— uncle

情况一: cur为红,p为红,g为黑,u存在且为红

数据结构(高阶)—— 红黑树_第4张图片

注意: 叔叔存在且为红时,cur结点是parent的左孩子还是右孩子,调整方法都是一样的。

情况二: cur为红,p为红,g为黑,u不存在/u为黑

说明:u的情况有两种

  • 如果u节点不存在,则cur一定是新插入节点,因为如果cur不是新插入节点,则cur和p一定有一个节点的颜色是黑色,就不满足性质4 —— 每条路径黑色节点个数相同。

数据结构(高阶)—— 红黑树_第5张图片

  • 如果u节点存在,则其一定是黑色的,那么cur节点原来的颜色一定是黑色的,现在看到其是红色的原因是因为cur的子树在调整的过程中将cur节点的颜色由黑色改成红色。

数据结构(高阶)—— 红黑树_第6张图片

1. p为g的左孩子,cur为p的左孩子,则进行右单旋转;

数据结构(高阶)—— 红黑树_第7张图片

2. p为g的右孩子,cur为p的右孩子,则进行左单旋转; 

p、g变色–p变黑,g变红

数据结构(高阶)—— 红黑树_第8张图片

 情况三: cur为红,p为红,g为黑,u不存在/u为黑

1.p为g的左孩子,cur为p的右孩子,则针对p做左单旋转;转换成了情况2,对g进行右单旋

数据结构(高阶)—— 红黑树_第9张图片

2.p为g的右孩子,cur为p的左孩子,则针对p做右单旋转; 转换成了情况2,对g进行左单旋

数据结构(高阶)—— 红黑树_第10张图片

bool Insert(const pair& kv)
{
	if (_root == nullptr)
	{
		_root = new Node(kv);
		_root->_col = BLACK;
		return true;
	}

	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return false;
		}
	}

	cur = new Node(kv);
	cur->_col = RED; // 新增节点

	if (parent->_kv.first < kv.first)
	{
		parent->_right = cur;
		cur->_parent = parent;
	}
	else
	{
		parent->_left = cur;
		cur->_parent = parent;
	}

	// 控制平衡
	while (parent && parent->_col == RED)
	{
		Node* grandfather = parent->_parent;
		if (parent == grandfather->_left) //parent是左孩子
		{
			Node* uncle = grandfather->_right;
			// 情况1、uncle存在且为红
			if (uncle && uncle->_col == RED)
			{
				// 变色+继续向上处理
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;

				cur = grandfather;
				parent = cur->_parent;
			}
			else //情况2和3:uncle不存在 / 存在且为黑
			{
				if (cur == parent->_left)//如果新增结点在parent的左侧,即是情况2
				{
					// 单旋
					RotateR(grandfather);
					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				else     //如果新增结点在parent的右侧,即是情况3
				{
					// 双旋
					RotateL(parent);
					RotateR(grandfather);
					cur->_col = BLACK;
					grandfather->_col = RED;
				}
				break;
			}
		}
		else // parent == grandfather->_right  //parent是右孩子
		{
			Node* uncle = grandfather->_left;
            // 情况1、uncle存在且为红
			if (uncle && uncle->_col == RED)
			{
				// 变色+继续向上处理
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;

				cur = grandfather;
				parent = cur->_parent;
			}
			else //情况2和3:uncle不存在 / 存在且为黑
			{
				if (cur == parent->_right)
				{
					RotateL(grandfather);
					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				else
				{
					RotateR(parent);
					RotateL(grandfather);
					cur->_col = BLACK;
					grandfather->_col = RED;
				}

				break;
			}
		}
	}
	_root->_col = BLACK;
	return true;
}

//左单选
void RotateL(Node* parent)
{
	Node* subR = parent->_right;
	Node* subRL = subR->_left;
	parent->_right = subRL;
	if (subRL)
	{
		subRL->_parent = parent;
	}
	Node* parentParent = parent->_parent;
	subR->_left = parent;
	parent->_parent = subR;

	if (parent == _root)//这里表明原来是根
	{
		_root = subR;
		subR->_parent = nullptr;
	}
	else
	{
		if (parentParent->_left == parent)
		{
			parentParent->_left = subR;
		}
		else
		{
			parentParent->_right = subR;
		}
		subR->_parent = parentParent;
	}
}

//右单旋
void RotateR(Node* parent)
{
	Node* subL = parent->_left;
	Node* subLR = subL->_right;
	parent->_left = subLR;

	if (subLR)
	{
		subLR->_parent = parent;
	}
	Node* parentParent = parent->_parent;
	subL->_right = parent;
	parent->_parent = subL;
	if (parent == _root)//这里表明原来是根
	{
		_root = subL;
		_root->_parent = nullptr;
	}
	else
	{
		if (parentParent->_left == parent)
		{
			parentParent->_left = subL;
		}
		else
		{
			parentParent->_right = subL;
		}
		subL->_parent = parentParent;
	}
}

五、红黑树的验证

利用中序遍历先判断是否是二叉搜索树 

void InOrder()
{
	_InOrder(_root);
}

void _InOrder(Node* root)
{
	if (root == nullptr)
	{
		return;
	}
	_InOrder(root->_left);
	cout << root->_kv.first << ":" << root->_kv.second << endl;
	_InOrder(root->_right);
}

        检测是否满足红黑树的性质:任意选取一条路径找出黑色结点的个数作为基准值,然后依次与其他路径比较,如果都相同则满足红黑树的性质;

bool IsBalance()
{
	if (_root && _root->_col == RED)
	{
		cout << "根结点不是黑色" << endl;//为了测试
		return false;
	}  
	//最左路径黑色结点数量做基准值
	int banchmark = 0;//保存最左侧路径中黑色结点的个数
	Node* left = _root;
	while (left) 
	{
		if (left->_col == BLACK)
			++banchmark;
		left = left->_left;
	}

	int blackNum = 0;//递归遍历时记录黑色结点的个数
	return _IsBalance(_root, banchmark, blackNum);
}

bool _IsBalance(Node* root, int banchmark, int blackNum)
{
    //走到null之后,判断banchmark和blackNum是否相等
	if (root == nullptr)
	{
		if (banchmark != blackNum)
		{
			cout << "存在路径黑色结点的数量不相等" << endl;//为了测试
			return false;
		}
		return true;
	}
	if (root->_col == RED && root->_parent->_col == RED)
	{
		cout<<"出现了连续的红色结点" << endl;//为了测试
		return false;
	}
	if (root->_col == BLACK)// 统计黑色节点的个数
	{
		++blackNum;
	}
	return _IsBalance(root->_left, banchmark, blackNum) 
		&& _IsBalance(root->_right, banchmark, blackNum);
}

六、红黑树与AVL树的比较

红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O(logN),

红黑树和AVL树控制二叉树平衡的方式不同:

  • AVL树是通过控制左右高度差不超过1来实现二叉树平衡的,实现的是二叉树的严格平衡。
  • 红黑树是通过控制结点的颜色,从而使得红黑树当中最长可能路径不超过最短可能路径的2倍,实现的是近似平衡。

        相对而言,红黑树降低了插入和旋转的次数,所以在经常进行增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。

七、源代码

#include 
using namespace std;

enum Colour
{
	RED,
	BLACK
};

template
struct RBTreeNode
{
	RBTreeNode* _left;
	RBTreeNode* _right;
	RBTreeNode* _parent;
	pair _kv;
	Colour _col;
	RBTreeNode(const pair& kv)
		:_left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _kv(kv)
		, _col(RED)
	{}
};

template
class RBTree
{
	typedef RBTreeNode Node;
public:
	RBTree()
		:_root(nullptr)
	{}
	bool Insert(const pair& kv)
	{
		if (_root == nullptr)
		{
			_root = new Node(kv);
			_root->_col = BLACK;
			return true;
		}

		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < kv.first)
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (cur->_kv.first > kv.first)
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return false;
			}
		}

		cur = new Node(kv);
		cur->_col = RED; // 新增节点
		if (parent->_kv.first < kv.first)
		{
			parent->_right = cur;
			cur->_parent = parent;
		}
		else
		{
			parent->_left = cur;
			cur->_parent = parent;
		}

		// 控制平衡
		while (parent && parent->_col == RED)
		{
			Node* grandfather = parent->_parent;
			if (parent == grandfather->_left)
			{
				Node* uncle = grandfather->_right;
				// 1、uncle存在且为红
				if (uncle && uncle->_col == RED)
				{
					// 变色+继续向上处理
					parent->_col = uncle->_col = BLACK;
					grandfather->_col = RED;

					cur = grandfather;
					parent = cur->_parent;
				}
				else // 2 + 3、uncle不存在/ 存在且为黑
				{
					if (cur == parent->_left)
					{
						// 单旋
						RotateR(grandfather);
						parent->_col = BLACK;
						grandfather->_col = RED;
					}
					else
					{
						// 双旋
						RotateL(parent);
						RotateR(grandfather);
						cur->_col = BLACK;
						grandfather->_col = RED;
					}
					break;
				}
			}
			else // parent == grandfather->_right
			{
				Node* uncle = grandfather->_left;
				if (uncle && uncle->_col == RED)
				{
					// 变色+继续向上处理
					parent->_col = uncle->_col = BLACK;
					grandfather->_col = RED;

					cur = grandfather;
					parent = cur->_parent;
				}
				else // 2 + 3、uncle不存在/ 存在且为黑
				{
					if (cur == parent->_right)
					{
						RotateL(grandfather);
						parent->_col = BLACK;
						grandfather->_col = RED;
					}
					else
					{
						RotateR(parent);
						RotateL(grandfather);
						cur->_col = BLACK;
						grandfather->_col = RED;
					}

					break;
				}
			}
		}
		_root->_col = BLACK;
		return true;
	}

	//左单选
	void RotateL(Node* parent)
	{
		Node* subR = parent->_right;
		Node* subRL = subR->_left;
		parent->_right = subRL;
		if (subRL)
		{
			subRL->_parent = parent;
		}
		Node* parentParent = parent->_parent;
		subR->_left = parent;
		parent->_parent = subR;

		if (parent == _root)//这里表明原来是根
		{
			_root = subR;
			subR->_parent = nullptr;
		}
		else
		{
			if (parentParent->_left == parent)
			{
				parentParent->_left = subR;
			}
			else
			{
				parentParent->_right = subR;
			}
			subR->_parent = parentParent;
		}
	}

	//由单旋
	void RotateR(Node* parent)
	{
		Node* subL = parent->_left;
		Node* subLR = subL->_right;
		parent->_left = subLR;
		if (subLR)
		{
			subLR->_parent = parent;
		}
		Node* parentParent = parent->_parent;
		subL->_right = parent;
		parent->_parent = subL;
		if (parent == _root)//这里表明原来是根
		{
			_root = subL;
			_root->_parent = nullptr;
		}
		else
		{
			if (parentParent->_left == parent)
			{
				parentParent->_left = subL;
			}
			else
			{
				parentParent->_right = subL;
			}
			subL->_parent = parentParent;
		}
	}

void InOrder()
{
	_InOrder(_root);
}

void _InOrder(Node* root)
{
	if (root == nullptr)
	{
		return;
	}
	_InOrder(root->_left);
	cout << root->_kv.first << ":" << root->_kv.second << endl;
	_InOrder(root->_right);
}

	bool IsBalance()
	{
		if (_root && _root->_col == RED)
		{
			cout << "根结点不是黑色" << endl;
			return false;
		}  
		//最左路径黑色结点数量做基准值
		int banchmark = 0;
		Node* left = _root;
		while (left) 
		{
			if (left->_col == BLACK)
				++banchmark;
			left = left->_left;
		}
		int blackNum = 0;
		return _IsBalance(_root, banchmark, blackNum);
	}

	bool _IsBalance(Node* root, int banchmark, int blackNum)
	{
		if (root == nullptr)
		{
			if (banchmark != blackNum)
			{
				cout << "存在路径黑色结点的数量不相等" << endl;
				return false;
			}
			return true;
		}
		if (root->_col == RED && root->_parent->_col == RED)
		{
			cout<<"出现了连续的红色结点" << endl;
			return false;
		}
		if (root->_col == BLACK)
		{
			++blackNum;
		}
		return _IsBalance(root->_left, banchmark, blackNum) 
			&& _IsBalance(root->_right, banchmark, blackNum);
	}

	int Height()
	{
		return _Height(_root);
	}
	int _Height(Node* root)
	{
		if (root == nullptr)
		{
			return 0;
		}
		int leftHeight = _Height(root->_left);
		int rightHeight = _Height(root->_right);
		return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
	}

private:
	Node* _root;
};

void TestRBTree()
{
	RBTree t;
	//int a[] = { 5,4,3,2,1,0 };
	int a[] = { 16,3,7,11,9,26,18,14,15 };
	//int a[] = { 4,2,6,1,3,5,15,7,16,14 };
	for (auto e : a)
	{
		t.Insert(make_pair(e, e));
		//cout << "Insert" << e << ":" << t.IsBalance() << endl;
	}
	t.InOrder();
	cout << t.IsBalance() << endl;
	cout << t.Height() << endl;

}

 

你可能感兴趣的:(高阶数据结构,数据结构,算法)