AVL树
平衡二叉查找树(Self-balancing binary search tree)通常是指一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且任意节点的左右两个子树都是一棵平衡二叉树(即严格的平衡二叉查找树,“严格”二字体现在任意节点的左右子树高度差不超过1),平衡二叉树有多种实现方法(红黑树、AVL、替罪羊树、Treap、伸展树等)本篇随笔分析的AVL树(AVL树是根据它的发明者G. M. Adelson-Velskii和E. M. Landis命名的),是在二叉查找树的基础上一个优化版本(AVL树是严格的二叉查找树,而红黑树不是,红黑树是非严格的二叉查找树,红黑树有自己的一套规则来保证整棵树接近平衡)
AVL树的特点:
1.本身首先是一棵二叉查找树
AVL树的作用
AVL树解决了二叉查找树可能出现的极端情况,对于一般的二叉搜索树(Binary Search Tree),其期望高度(即为一棵平衡树时)为log2n,其各操作的时间复杂度(O(log2n))同时也由此而决定,但是在某些极端情况下
(如在插入的序列是有序的时),二叉搜索树将退化成近似链或链,此时,其操作的时间复杂度将退化成线性的,即O(n)。我们可以通过随机化建立二叉搜索树来尽量的避免这种情况,但是在进行了多次的操作之后,例如在在删除时,
我们总是选择将待删除节点的后继代替它本身,这样就会造成总是右边的节点数目减少,以至于树向左偏沉。这同时也会造成树的平衡性受到破坏,使得它的操作时间复杂度增加
例如下面这种情况:
AVL树的特性让二叉搜索树的节点实现平衡(balance):节点相对均匀分布,而不是偏向某一侧
AVL树节点的定义:
1 typedef struct AVLTreeNode
2 {
3 int data;
4 int height; //节点的高度
5 struct BSTreeNode *left;//左子树
6 struct BSTreeNode *right;//右子树
7
8 }AVLTree;
与一般的二叉查找树的节点相比多了一个参数,节点的高度(网上有些博客是把平衡因子加在了节点的定义里面,笔者不太建议这样做)
预备知识
为了读者能更好了理解AVL树的操作,在继续往下看之前需要搞清楚几个概念
高度、深度和平衡因子
(1)深度——从上往下数
(树的深度 = 叶子节点的深度)
(2)高度——从下往上数
关于高度,有的文章中将"空二叉树的高度定义为-1",本篇随笔采用维基百科上的定义:空二叉树的高度为0,因为高度是从下往上数,所以叶子节点的高度为1
(树的高度 = 根节点的高度)
(3)平衡因子
(平衡因子计算时左子树 - 右子树 和 右子树 - 左子树 都可以,因为判断树是否平衡的条件是:每个结点的左右子树的高度之差的绝对值不超过1,只不过判断失衡以后还要判断是哪一种失衡,这就需要根据情况来选择是左-右还是右-左了)
-----------------------------------------------------------------------------------------------------
1、查找节点
在 AVL树 中查找与在 二叉查找树 中查找完全一样,因为AVL树总是保持平衡的,树的结构不会由于查询而改变,这里就不再赘述了
实现代码:
1 /* 查找特定值 */ 2 void SearchData(int targ, BSTree *nod) 3 { 4 if (nod != NULL) 5 { 6 if (nod->data == targ) 7 { 8 printf("查找值存在,值为%d\n", nod->data); 9 } 10 else if (nod->data > targ) 11 { 12 SearchData(targ, nod->left); //递归查找左子树 13 } 14 else if (nod->data < targ) 15 { 16 SearchData(targ, nod->right); //递归查找右子树 17 } 18 } 19 else if (nod == NULL) 20 { 21 printf("查找值不存在\n"); 22 } 23 }
2、插入节点(递归实现)
先梳理一下步骤
先来实现搜索最低失衡节点,搜索最低失衡节点是从新插入的节点(也就是叶子节点)往上搜索(也可以说成从新增结点开始向根部回溯),搜索到的第一个平衡因子>1(|左子树高度-右子树高度|>1)的节点,作为最低失衡节点,因为是从新插入的节点往上搜索,二叉树的搜索是单向的(结构体成员中只有左右子树),单独使用一个函数来实现逆向搜索实现起来并不方便,这里就把搜索最低失衡节点的操作放到递归实现的插入操作中
这里没有像上一篇随笔:二叉查找树(查找、插入、删除)——C语言那样先手动输入的一个二叉平衡树(因为这里要考虑节点的高度,输入不太方便),干脆就从空二叉树开始插入
实现代码:
/* 获取节点高度,空树的高度为0 */
int GetNodeHeight(AVLTree *nod)
{
if (nod != NULL) //若不为空子树
{
if (nod->left == NULL && nod->right == NULL) //若为叶子节点
{
return 1;
}
else if (GetNodeHeight(nod->right) > GetNodeHeight(nod->left)) //若右子树高度较高
{
return (nod->right)->height + 1;
}
else //若左子树高度较高
{
return (nod->left)->height + 1;
}
}
else //若为空子树
{
return 0;
}
}
/* 添加新节点(包含搜索最低失衡节点和调整树操作) */
AVLTree *AddNewNode(AVLTree *nod, int NewData)
{
AVLTree *p = NULL;
if (nod == NULL)
{
if ((nod = (AVLTree *)malloc(sizeof(AVLTree))) == NULL) //创建新节点
{
printf("内存不足");
exit(0);
}
nod->data = NewData;
nod->left = NULL;
nod->right = NULL;
nod->height = GetNodeHeight(nod);
}
else if (NewData > nod->data)
{
nod->right = AddNewNode(nod->right, NewData);
nod->height = GetNodeHeight(nod);
if (GetNodeHeight(nod->right) - GetNodeHeight(nod->left) > 1) //右子树高度 - 左子树高度
{
}
return nod;
}
else if (NewData < nod->data)
{
nod->left = AddNewNode(nod->left, NewData);
nod->height = GetNodeHeight(nod);
if (GetNodeHeight(nod->left) - GetNodeHeight(nod->right) > 1) //左子树高度 - 右子树高度
{
}
return nod;
}
else if (NewData == nod->data)
{
printf("不允许插入重复值");
exit(0);
}
return nod;
}
(若二叉树中只有根节点,那么这个根节点也是叶子节点)
在上面的代码中已经实现了插入新节点并且搜索最低失衡节点的功能,这里可以用前序遍历二叉树并打印节点高度来判断插入节点函数是否正确(上面预留的调整二叉树函数的位置)
遍历二叉树:
1 /* 前序遍历AVL树,并打印节点高度 */
2 void PreOrder_Traverse(AVLTree *nod)
3 {
4 if (nod != NULL)
5 {
6 printf("data = %d height = %d\n", nod->data, nod->height);
7
8 PreOrder_Traverse(nod->left);
9 PreOrder_Traverse(nod->right);
10 }
11 }
测试插入函数(保证每次插入新节点后的二叉树都是二叉平衡树)
测试数据图解:
测试结果:
搞清楚了各个节点的高度,平衡因子的计算也比较方便了,下面就是AVL树的核心操作“旋转”,不同的失衡情况有不同的旋转方式,一共有四种节点失衡情况,如下图
不同失衡情况下的示例二叉树,如下图(读者可能会发现“最低失衡节点的左子树的左子树还有非空节点”这个判断依据,对第二组图适用,但对于第一组图不太合适)
或者是
(LL型和RR型的操作相对简单)
第一种:LL型
LL型失衡,调整二叉树需要两步
第一步:将失衡节点的左子树的右子树 变成 失衡节点的左子树
第二步:失衡节点 变成 失衡节点未发生操作前左子树的右子树
只看上面的叙述有点绕,下面为实现代码和图片示例
实现代码:
1 /* LL型旋转 */
2 AVLTree * LL_Rotation(AVLTree *nod)
3 {
4 AVLTree *temp;
5 temp = nod->left; //临时保存nod的左子树
6
7 nod->left = nod->left->right; //将失衡节点的左子树的右子树 变成 失衡节点的左子树
8 temp->right = nod; //失衡节点 变成 temp的右子树
9
10 nod->height = GetNodeHeight(nod); //更新节点高度
11 temp->height = GetNodeHeight(temp);
12
13 return temp;
14 }
LL型旋转图解
GIF图:
(图片来源:http://www.sohu.com/a/270452030_478315)
LL型失衡测试:
测试数据:
测试结果:
第二种:RR型
RR型的操作和基本相同,只是方向相反,这里就不再赘述了
实现代码:
1 /* RR型旋转 */ 2 AVLTree * RR_Rotation(AVLTree *nod) 3 { 4 AVLTree *temp; 5 temp = nod->right; //临时保存nod的右子树 6 7 nod->right = nod->right->left; 8 temp->left = nod; 9 10 nod->height = GetNodeHeight(nod); //更新节点高度 11 temp->height = GetNodeHeight(temp); 12 13 return temp; 14 }
第三种:LR型
LR型失衡的操作相比于LL型失衡操作相对要复杂一点,需要旋转两次才能恢复平衡
第一步:对失衡节点的左子树进行RR型旋转
第二步:对失衡节点进行LL型旋转
因为之前已经写好了LL型和RR型的旋转,这里直接用就可以了,实现代码如下
1 /* LR型旋转 */
2 AVLTree * LR_Rotation(AVLTree *nod)
3 {
4 nod->left = RR_Rotation(nod->left);
5 nod = LL_Rotation(nod);
6
7 return nod;
8 }
LR型旋转图解:
测试数据:
第三种:RL型
和LR型的旋转基本相同,这里就不再赘述了,实现代码如下
1 /* RL型旋转 */ 2 AVLTree * RL_Rotation(AVLTree *nod) 3 { 4 nod->right = LL_Rotation(nod->right); 5 nod = RR_Rotation(nod); 6 7 return nod; 8 }
3、删除节点
删除节点比插入节点的操作还要稍微复杂一点,因为插入时,进行一次平衡处理(一次平衡处理可能包含多次旋转),整棵树都会处于平衡状态,而在删除时,需要进行多次平衡处理,才能保证树处于平衡状态
AVL树的删除操作前半部分和二叉查找树相同,只不过删除后要检查树是否失去平衡,如果失衡就需要重新调整平衡,并更新节点高度,总的来说可以分为如下几种情况
(1)删除叶子节点
情况一:删除节点后二叉树没有失去平衡
删除节点后树没有失去平衡,这种情况下只需要更新节点的高度
情况二:删除节点后二叉树失去平衡
上图的RE型失衡只有在删除操作时才可能出现(在插入时不可能出现),RE型失衡的旋转方式和RR型失衡的旋转方式一模一样
(虽然删除节点时遇到的失衡情况多了两种 LE和RE ,但是旋转的方式依旧是那四种(LL、RR、LR、RL))
实现代码:
1 /* 删除节点 */
2 AVLTree *DeletNode(AVLTree *nod, int DelData)
3 {
4 AVLTree *SNode = NULL; //后继节点
5 AVLTree *PSNode = NULL; //后继节点的父节点
6 AVLTree *temp = NULL; //临时保存待释放节点的子树,避免free后找不到左右子树
7
8 if (nod == NULL)
9 {
10 printf("删除节点不存在");
11 exit(0);
12 }
13 else if (DelData > nod->data)
14 {
15 nod->right = DeletNode(nod->right, DelData);
16
17 if (GetNodeHeight(nod->left) - GetNodeHeight(nod->right) > 1)
18 {
19 temp = nod->left;
20
21 if (GetNodeHeight(temp->left) >= GetNodeHeight(temp->right)) //LL型或LE型失衡、两种情况处理方式相同
22 {
23 nod = LL_Rotation(nod);
24 }
25 else //LR型失衡
26 {
27 nod = LR_Rotation(nod);
28 }
29 }
30
31 nod->height = GetNodeHeight(nod); //更新节点高度
32 }
33 else if (DelData < nod->data)
34 {
35 nod->left = DeletNode(nod->left, DelData);
36
37 if (GetNodeHeight(nod->right) - GetNodeHeight(nod->left) > 1)
38 {
39 temp = nod->right;
40
41 if (GetNodeHeight(temp->right) >= GetNodeHeight(temp->left)) //RR或RE型失衡、两种情况处理方式相同
42 {
43 nod = RR_Rotation(nod);
44 }
45 else //RL型失衡
46 {
47 nod = RL_Rotation(nod);
48 }
49 }
50
51 nod->height = GetNodeHeight(nod); //更新节点高度
52 }
53 else if (DelData == nod->data)
54 {
55 if (nod->right == NULL && nod->left == NULL) //若待删除节点为叶子节点
56 {
57 free(nod);
58 return NULL;
59 }
60 }
(2)删除带有一个子节点的节点
1 else if (DelData == nod->data)
2 {
3 if (nod->right == NULL && nod->left == NULL) //若待删除节点为叶子节点
4 {
5 free(nod);
6 return NULL;
7 }
8 else if (nod->right == NULL && nod->left != NULL) //若待删除节点只有左子树
9 {
10 temp = nod->left;
11 free(nod);
12
13 return temp;
14 }
15 else if (nod->right != NULL && nod->left == NULL) //若待删除节点只有右子树
16 {
17 temp = nod->right;
18 free(nod);
19
20 return temp;
21 }
22 }
(3)删除带有两个子节点的节点
删除带有两个子节点的节点时,需要找到待删除的节点的后继节点或者前驱节点(本篇随笔使用后继节点),具体方法在上一篇随笔已经列出“二叉查找树(查找、插入、删除)——C语言”,这里不再赘述
1 else //若待删除节点既有左子树也有右子树
2 {
3 SNode = SearchSuccessorNode(nod->right); //搜索后继节点
4 PSNode = SearchParentofSNode(nod->right, nod->right); //搜索后继节点的父节点
5
6 if (nod->right == SNode) //后继节点为待删除节点的右子树(后继节点有右子树和没有右子树的操作相同)
7 {
8 SNode->left = nod->left;
9 free(nod);
10
11 return SNode;
12 }
13 else if (nod->right != SNode && SNode->right == NULL) //后继节点不为待删除节点的右子树,并且该后继节点没有右子树
14 {
15 SNode->left = nod->left;
16 SNode->right = nod->right;
17 PSNode->left = NULL;
18 free(nod);
19
20 return SNode;
21 }
22 else if (nod->right != SNode && SNode->right != NULL) //后继节点不为待删除节点的右子树,并且该后继节点有右子树
23 {
24
25 PSNode->left = SNode->right; //后继节点的右子树作为后继节点父节点的左子树
26 SNode->left = nod->left;
27 SNode->right = nod->right;
28 free(nod);
29
30 return SNode;
31 }
32 }
33 }
需要注意的是,删除节点时不会出现“后继节点不是删除节点的子节点,且后继节点有右子树”这种情况,如下图
上图的14节点已经失衡了,在插入的时候就会被调整,所以不会出现“后继节点不是删除节点的子节点,且后继节点有右子树”这种情况
(由于笔者能力有限,AVL树的删除操作分析的不是很清楚,若有疏漏,清指出)