问题引入:
在上文我们提到了二叉搜索树在按值顺序插入时,会形成单边树,会大大降低二叉搜索树的性能。因此我们要将二叉搜索树进行平衡,采取适当的平衡措施,从而减低二叉搜索树的高度,使二叉搜索树达到一个接近于完全二叉树的样子(如下图所示),提高二叉搜索树的性能。本节我们要介绍的平衡树为AVL树。
目录
1.AVL树
1.1 AVL树的概念
2.AVL树节点的定义
3.AVL树的插入与旋转
3.1 左单旋
代码实现左单旋
3.2 右单旋
代码实现右单旋
3.3 先左单旋再右单旋
左右双旋代码实现:
3.4 先右单旋再左单旋
右左双旋代码实现
Insert实现代码
4.判断一棵树是否是AVL树
验证AVL树代码实现:
5.AVL树的验证与查看
验证与查看:
1.顺序插入
2.随机值
6.AVL树的性能
附录:
在上述我们所提到,二叉搜索树虽然可以缩短查找的效率,但如果数据有序或接近有序时,二叉搜索树将退化为单支树(单边树),查找元素相当于在顺序表中搜索元素,效率十分低下。因此,两位俄罗斯数学家G.M.Adelson-Velski和E.M.Landis 在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新节点后,如果能保证每个节点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一颗AVL树或者空树具有一下性质:
如果一颗二叉搜索树是高度平衡的,他就是AVL树。如果它有n个节点,其高度可保持在O(log N),搜索时间复杂度为O(logN)。
此时我们大致了解了AVL树的平衡规则,接下来我们将手动模拟实现一下AVL树的主要功能。
AVL树节点的定义
我们在此处实现的是KV模型的AVL树,K模型的较为简单,大家可以自己尝试实现。
template
struct AVLTreeNode
{
pair _kv;
AVLTreeNode* _left;
AVLTreeNode* _right;
AVLTreeNode* _parent;
// 右子树-左子树 的高度差
int _bf; // balance factor
AVLTreeNode(const pair& kv)
:_kv(kv)
, _left(nullptr)
, _right(nullptr)
, _parent(nullptr)
, _bf(0)
{}
// AVL树并没有规定必须要设计平衡因子
// 只是一个实现的选择,方便控制平衡
};
从节点的定义我们可以看出,有普通的二叉搜树不同的是,AVL树中节点的设置添加了节点的parent节点,此处也是为了方便后续功能的实现(接着往下看就明白了)。除此之外,节点也定义了一个控制平衡因子_bf,用来表示当前节点右子树与左子树的高度差。
AVL树的插入就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看做一个二叉搜索树。
AVL树的插入过程可以分为两步:
AVL树在插入的过程中,如果插入新节点后导致AVL树中某些节点的平衡因子的绝对值大于等于1时,要进行旋转操作,根据节点插入位置的不同,AVL树的旋转分为四种。接下来我们逐一分析可能出现的情况与解决该问题的旋转方法。
什么时候我们需要进行左单旋转呢?当新节点插入较高右子树的右侧时,我们看一个需要左单旋的最简单的情况。
在下图中,当树要插入节点90,此时根节点的平衡因子为2,已经不满足AVL树的规则,因此要进行旋转。我们发现新节点插入了较高右子树的右侧。因此需要进行左单旋(即就是将右子树提上去)。
左单旋的步骤:
1.让插入节点的父节点,也就是这里的60的左子树变成节点30的右子树,30这颗子树成为60的左子树。
2.调整改变节点的平衡因子。
由于我们这里是最简单的情况,如果我们变成较为复杂的情况,如下图所示。
在这个图中,无论在b还是c树下插入新节点,都是在30的右树下插入新节点,因此这里将有4中可能性(分别是b的左右孩子,c的左右孩子处),这里以c的孩子为例。但是情况均为右单旋情况。
旋转步骤为:将60的左树变为30的右树,再让30成为60的左树,最后更改旋转因子。
需要考虑的特殊情况:
void RotateL(Node* parent)
{
//左旋
Node* subR = parent->_right;
Node* subRL = subR->_left;
parent->_right = subRL;
if (subRL)
subRL->_parent = parent;
Node* ppNode = parent->_parent;
subR->_left = parent;
parent->_parent = subR;
if (parent == _root)
{
_root = subR;
_root->_parent = nullptr;
}
else
{
if (parent == ppNode->_left)
{
ppNode->_left = subR;
}
else
{
ppNode->_right = subR;
}
subR->_parent = ppNode;
}
//更新平衡因子
parent->_bf = 0;
subR->_bf = 0;
}
右单旋是当新节点插入较高的左子树的左侧时进行使用。我们也来看一个最简单的右单旋的情况。
在下图中,当我们要新插入节点10,我们发现30的左子树增加了一层,导致以60位根的二叉树不平衡,要让60平衡,只能将60的左子树的高度减少一层,右子树增加一层。即将左子树提上来。
旋转步骤为:将30的右子树变成60的左子树,再让60变成30的左子树。旋转完成后更新节点的平衡因子即可。
由于我们这里是最简单的情况,如果我们变成较为复杂的情况,如下图所示。
右单旋需要考虑的情况:
void RotateR(Node* parent)
{
//右旋
Node* subL = parent->_left;
Node* subLR = subL->_right;
parent->_left = subLR;
if (subLR)
subLR->_parent = parent;
Node* ppNode = parent->_parent;
subL->_right = parent;
parent->_parent = subL;
if (parent == _root)
{
_root = subL;
_root->_parent = nullptr;
}
else
{
if (ppNode->_left == parent)
{
ppNode->_left = subL;
}
else
{
ppNode->_right = subL;
}
subL->_parent = ppNode;
}
subL->_bf = parent->_bf = 0;
}
这是一种很复杂的情况,当新节点插入较高左子树的右侧时,要发生左右单旋。
我们来看具体例子直观感受这种情况。将双旋变成单旋再旋转,即对30进行左单旋再对90进行右单旋,旋转完再考虑平衡因子的更新。
//左右双旋
void RotateLR(Node* parent)
{
Node* subL = parent->_left;
Node* subLR = subL->_right;
int bf = subLR->_bf;
RotateL(parent->_left);//左
RotateR(parent);//右
//更新平衡因子
if (bf == 0)
{
parent->_bf = 0;
subL->_bf = 0;
subLR->_bf = 0;
}
else if (bf == 1)
{
parent->_bf = 0;
subL->_bf = -1;
subLR->_bf = 0;
}
else if (bf == -1)
{
parent->_bf = 1;
subL->_bf = 0;
subLR->_bf = 0;
}
else
{
// subLR->_bf 旋转前就出现问题
assert(false);
}
}
当新节点插入较高右子树的左侧时就要进行右左单旋。我们直接来看具体情况
将右左双旋变成单旋再旋转,即对90进行右单旋再对30进行左单旋,旋转完再考虑平衡因子的更新。
//右左双旋
void RotateRL(Node* parent)
{
Node* subR = parent->_right;
Node* subRL = subR->_left;
int bf = subRL->_bf;
RotateR(parent->_right);
RotateL(parent);
if (bf == 0)
{
subRL->_bf = 0;
parent->_bf = 0;
subR->_bf = 0;
}
else if (bf == 1)
{
subRL->_bf = 0;
parent->_bf = -1;
subR->_bf = 0;
}
else if(bf == -1)
{
subRL->_bf = 0;
parent->_bf = 0;
subR->_bf = 1;
}
else
{
// subLR->_bf 旋转前就有问题
assert(false);
}
}
AVL树的旋转共以上四种情况。
总结:
加入pParent为根的子树不平衡是,即pParent的平衡因子为2或者-2,分以下情况考虑
旋转完成后,原pParent为跟的子树的高度降低,已经平衡,不需要再向上更新了。
考虑完所有的旋转情况后,我们此时实现insert插入。
insert插入大框架还是二叉搜索树的insert,只不过加入了平衡因子,不平衡时进行旋转。
bool Insert(const pair& kv)
{
//1、按照搜索树的规则插入
//2、看是否违反平衡规则,如果违反就需要处理:旋转
if (_root == nullptr)
{
_root = new Node(kv);
_root->_bf = 0;
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
//.....
//更新平衡因子
while (parent)
{
if (cur == parent->_right)
{
parent->_bf++;
}
else
{
parent->_bf--;
}
//是否继续更新?
// 1 or -1 ->插入节点填上了矮的那边
if (parent->_bf == 0)
{
break;
}
//0->1 或者 -1 插入节点导致一边变高了
else if (parent->_bf == 1 || parent->_bf == -1)
{
//子树的高度变了,继续更新祖先
cur = cur->_parent;
parent = parent->_parent;
}
// -1 or 1 -》 2 or -2 插入几点导致本来高的一边更高了
else if (parent->_bf == 2 || parent->_bf == -2)
{
//子树不平衡-- 需要旋转处理
if (parent->_bf == 2 && cur->_bf == 1)//左单旋
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == -1)//右
{
RotateR(parent);
}
else if (parent->_bf == -2 && cur->_bf == -1)//左右双旋
{
RotateLR(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1) // 右左双旋
{
RotateRL(parent);
}
break;
}
else
{
//插入之前AVL树就存在不平衡子树
assert(false);
}
}
return true;
}
由于AVL是在二叉搜索树的基础上加入了平衡机制,因此验证AVL树可以分为两步:
如果中序遍历可得到一个有序的序列,就说明是二叉搜索树
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_kv.first << " ";
_InOrder(root->_right);
}
int _Height(Node* root)
{
if (root == nullptr)
return 0;
int lh = _Height(root->_left);
int rh = _Height(root->_right);
return lh > rh ? lh + 1 : rh + 1;
}
//是否是平衡树
bool _IsBalanceTree(Node* root)
{
// 空树也是AVL树
if (nullptr == root)
return true;
// 计算pRoot节点的平衡因子:即pRoot左右子树的高度差
int leftHeight = _Height(root->_left);
int rightHeight = _Height(root->_right);
int diff = rightHeight - leftHeight;
// 如果计算出的平衡因子与pRoot的平衡因子不相等,或者
// pRoot平衡因子的绝对值超过1,则一定不是AVL树
if (abs(diff) >= 2)
{
cout << root->_kv.first << "节点平衡因子异常" << endl;
return false;
}
if (diff != root->_bf)
{
cout << root->_kv.first << "节点平衡因子不符合实际" << endl;
return false;
}
// pRoot的左和右如果都是AVL树,则该树一定是AVL树
return _IsBalanceTree(root->_left)
&& _IsBalanceTree(root->_right);
}
我们使用层序遍历的方式输出打印可以直观查看AVL树。使用层序遍历需要借助队列。
//层序输出
vector> levelOrder() {
vector> vv;
if (_root == nullptr)
return vv;
queue q;
int levelSize = 1;
q.push(_root);
while (!q.empty())
{
// levelSize控制一层一层出
vector levelV;
while (levelSize--)
{
Node* front = q.front();
q.pop();
levelV.push_back(front->_kv.first);
if (front->_left)
q.push(front->_left);
if (front->_right)
q.push(front->_right);
}
vv.push_back(levelV);
for (auto e : levelV)
{
cout << e << " ";
}
cout << endl;
// 上一层出完,下一层就都进队列
levelSize = q.size();
}
return vv;
}
我们手动模拟一些值,让其插入输出。
void TestAVLTree2()
{
const size_t N = 10;
vector v;
v.reserve(N);
srand(time(0));//生成随机树
for (size_t i = 0; i < N; ++i)
{
//v.push_back(rand());
v.push_back(i);
}
AVLTree t;
for (auto e : v)
{
t.Insert(make_pair(e, e));
}
t.levelOrder();
cout << endl;
cout << "是否平衡?" << t.IsBalanceTree() << endl;
cout << "高度:" << t.Height() << endl;
//t.InOrder();
}
AVL树是一颗绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即O(log N)。但是如果要对AVL树做一些结构修改的操作,性能非常低下。比如:插入是要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,可能要一直让旋转持续到根。这也是为什么本篇没有分析AVL的删除。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会变),可以考虑AVL树,但如果要经常修改,就不适合使用AVL树。
(本篇完)
#pragma once
#include
#include
#include