手撕AVL树

目录

一、概念

二、 结点的定义

2.1 键值对pair

2.2 定义细节

三、 AVL树的插入操作

3.1 平衡因子调整规则

3.2 旋转规则

3.2.1 新结点插入较高左子树的左侧 — 左左:右单旋 

3.2.2 新结点插入较高右子树的右侧 — 右右:左单旋

3.2.3 新结点插入较高左子树的右侧 — 左右:左右双旋

3.2.4 新结点插入较高右子树的左侧 — 右左:右左双旋

四、 AVL树的删除操作

五、 AVL树性能分析

六、 完整代码


一、概念

二叉搜索树虽可以缩短查找的效率,但若数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在链表中搜索元素,效率低下。

因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,若能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
 

一棵AVL树是空树 或 具有以下性质的二叉搜索树:
1. 它的左右子树都是AVL树
2. 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)    右子树高度减去左子树高度
3. 若一棵二叉搜索树是高度平衡的,其就是AVL树。
    若它有n个结点,其高度可保持在log_2 n,搜索时间复杂度O(log_2 n)
4. 不允许键值冗余

二、 结点的定义

2.1 键值对pair

pair是用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息

SGI-STL中对于pair的定义:

template 
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;
    pair(): first(T1()), second(T2()) {}
    pair(const T1& a, const T2& b): first(a), second(b) {}
};

使用时需要显示指定元素类型会导致代码过长,并且频繁使用时较为麻烦,于是出现make_pair进行自动类型推导。其定义为:

template 
pair make_pair (T1 x, T2 y)
{    
    return ( pair(x,y) );
}

2.2 定义细节

结点中存储了左子树指针、右子树指针和父指针以及一个键值对(即数据域)、平衡因子。不过平衡因子并不是必要的,没有平衡因子同样可以实现AVL树。

struct AVLTreeNode {
	AVLTreeNode(const pair& kv) :
            _parent(nullptr), _left(nullptr), 
            _right(nullptr),_data(kv),_balance_factor(0) {}

	AVLTreeNode* _parent;
	AVLTreeNode* _left;
	AVLTreeNode* _right;

	pair _data;
	int _balance_factor;//平衡因子
};

普通二叉树和搜索二叉树都是二叉链(没有父指针),为什么AVL树会需要使用三叉链呢?

这个问题可以从后面的讲解得到答案。
插入和删除结点、旋转 、平衡因子调整,这些操作都会需要频繁的使用父指针,使用三叉链可以减少查找父结点的时间复杂度并且使得AVL树的实现更加方便。

三、 AVL树的插入操作

AVL本质上就是具有特殊性质的二叉搜索树,其插入操作与二叉搜索树较为相似,不过更为复杂。

AVL树的插入过程可以分为两步
1. 按照二叉搜索树的方式插入新节点    2. 调整节点的平衡因子

bool insert(const pair& kv) {
    //第一步: 按照二叉搜索树的方式插入新节点 
	if (_root == nullptr) {
		_root = new TreeNode(kv);
		return true;
	}

	TreeNode* parent = nullptr;
	TreeNode* cur = _root;
	while (cur != nullptr) {
		if (kv.first > cur->_data.first) {
			parent = cur;
			cur = cur->_right;
		}
		else if (kv.first < cur->_data.first) {
			parent = cur;
			cur = cur->_left;
		}
		else return false;
	}
	cur = new TreeNode(kv);
	if (kv.first > parent->_data.first) {
		parent->_right = cur;
    }
	else { //kv.first < parent->_data.first)
		parent->_left = cur;
	}
	cur->_parent = parent;
    
    //调整平衡因子
    //………………    
}

但是平衡因子是如何调整的呢?

3.1 平衡因子调整规则

1. 若新增结点在其父结点的左边,则父结点的平衡因子 -1;若新增结点在其父结点的右边,则父结点的平衡因子 +1。

2. 更新后,若父结点的平衡因子为1 或 -1,说明插入前父结点的平衡因子为0,插入后父结点所在子树的高度发生变化,需要继续向上更新

3.更新后,若父结点的平衡因子为0,说明插入前父结点的平衡因子为1 或 -1,插入到了父结点矮的一边,父结点所在子树的高度并未发生变化,所以不需继续向上更新

4.更新后,若父结点的平衡因子为2 或 -2,说明插入前父结点的平衡因子为1 或 -1(达到平衡临界值),插入后已经破坏平衡,此时父结点所子树需要进行旋转处理

5.更新后,若父结点的平衡因子的绝对值大于2(理论上而言不可能),说明插入前该树就不是AVL树,需检查之前的操作。

while (parent != nullptr){
    //规则1
    if (cur == parent->_right) ++parent->_balance_factor;
	else --parent->_balance_factor;
    
    //规则2
	if(parent->_balance_factor == 0) break;
    
    //规则3
	else if (abs(parent->_balance_factor) == 1) {
		cur = parent;
		parent = parent->_parent;
	}

    //规则4
	else if (abs(parent->_balance_factor) == 2) {
		//需要旋转
        //………………
	}

    //规则5
    else {
		assert(false);
	}
    return true;
}

3.2 旋转规则

AVL树的旋转可以分为四种:

3.2.1 新结点插入较高左子树的左侧 — 左左:右单旋 

手撕AVL树_第1张图片

//发生右旋的判断条件
if (parent->_balance_factor == -2 && cur->_balance_factor == -1) {
	rotate_right(parent);
}
void rotate_right(TreeNode* parent) {
	TreeNode* subL = parent->_left;
	TreeNode* subLR = subL->_right;
	TreeNode* pparent = parent->_parent;//发生旋转的子树的父结点

	parent->_left = subLR;
	if (subLR != nullptr) subLR->_parent = parent;//h可能为0,即空树
	subL->_right = parent;
	parent->_parent = subL;

    //父结点所在的子树发生右旋转后,该子树的根结点发生改变
	if (_root == parent) {
		_root = subL;
		subL->_parent = nullptr;
	}
	else {
		if (pparent->_left == parent) pparent->_left = subL;
		else pparent->_right = subL;
		subL->_parent = pparent;
	}

    //更新平衡因子
	subL->_balance_factor = parent->_balance_factor = 0;
}

3.2.2 新结点插入较高右子树的右侧 — 右右:左单旋

手撕AVL树_第2张图片

//发生左旋的判断条件
if (parent->_balance_factor == 2 && cur->_balance_factor == 1) {
    rotate_left(parent);
}
void rotate_right(TreeNode* parent) {
	TreeNode* subL = parent->_left;
	TreeNode* subLR = subL->_right;
	TreeNode* pparent = parent->_parent;//发生旋转的子树的父结点

	parent->_left = subLR;
	if (subLR != nullptr) subLR->_parent = parent;//h可能为0,即空树
	subL->_right = parent;
	parent->_parent = subL;

    //parent所在的子树发生左旋转后,该子树的根结点发生变化
	if (_root == parent) {
		_root = subL;
		subL->_parent = nullptr;
	}
	else {
		if (pparent->_left == parent) pparent->_left = subL;
		else pparent->_right = subL;
		subL->_parent = pparent;
	}
    
    //更新平衡因子
	subL->_balance_factor = parent->_balance_factor = 0;
}

3.2.3 新结点插入较高左子树的右侧 — 左右:左右双旋

手撕AVL树_第3张图片

手撕AVL树_第4张图片

手撕AVL树_第5张图片

void rotate_left_right(TreeNode* parent) {
	TreeNode* subL = parent->_left;
	TreeNode* subLR = subL->_right;
	int bf = subLR->_balance_factor;

	rotate_left(parent->_left);
	rotate_right(parent);

	//更新平衡因子
	subLR->_balance_factor = 0;

    //情况一
	if (bf == 1) {
		parent->_balance_factor = 0;
		subL->_balance_factor = -1;
	}
    //情况二
	else if (bf == -1) {
		parent->_balance_factor = 1;
		subL->_balance_factor = 0;
	}
    //情况三
	else if (bf == 0) {
		parent->_balance_factor = 0;
		subL->_balance_factor = 0;
	}
	else assert(false);
}

3.2.4 新结点插入较高右子树的左侧 — 右左:右左双旋

手撕AVL树_第6张图片

手撕AVL树_第7张图片

手撕AVL树_第8张图片

void rotate_right_left(TreeNode* parent) {
	TreeNode* subR = parent->_right;
	TreeNode* subRL = subR->_left;
	int bf = subRL->_balance_factor;

	rotate_right(parent->_right);
	rotate_left(parent);

    //调整平衡因子
	subRL->_balance_factor = 0;

    //情况一
	if (bf == 1) {
		parent->_balance_factor = -1;
		subR->_balance_factor = 0;
	}
    //情况二
	else if (bf == -1) {
		parent->_balance_factor = 0;
		subR->_balance_factor = 1;
	}
    //情况三
	else if (bf == 0) {
		parent->_balance_factor = 0;
		subR->_balance_factor = 0;
	}

	else assert(false);
}

四、 AVL树的删除操作

因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不
过与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。
 

五、 AVL树性能分析

AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1
这样可以保证查询时高效的时间复杂度,即O(log_2 N)
但是若要对AVL树做一些结构修改的操作,性能非常低下。比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置
因此若需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合

六、 完整代码

#include 
#include 
#include 
#include 
using std::cout;
using std::endl;
using std::max;
using std::swap;
using std::pair;
using std::make_pair;

template
struct AVLTreeNode {
	AVLTreeNode(const pair& kv) :_parent(nullptr), _left(nullptr), _right(nullptr),_data(kv),_balance_factor(0) {}

	AVLTreeNode* _parent;
	AVLTreeNode* _left;
	AVLTreeNode* _right;

	pair _data;
	int _balance_factor;//平衡因子
};

template
class AVLTree 
{
	typedef AVLTreeNode TreeNode;
public:
	bool insert(const pair& kv) {
		if (_root == nullptr) {
			_root = new TreeNode(kv);
			return true;
		}

		TreeNode* parent = nullptr;
		TreeNode* cur = _root;
		while (cur != nullptr) {
			if (kv.first > cur->_data.first) {
				parent = cur;
				cur = cur->_right;
			}
			else if (kv.first < cur->_data.first) {
				parent = cur;
				cur = cur->_left;
			}
			else return false;
		}
		cur = new TreeNode(kv);
		if (kv.first > parent->_data.first) {
			parent->_right = cur;
		}
		else { //kv.first < parent->_data.first)
			parent->_left = cur;
		}
		cur->_parent = parent;

		//控制平衡
		//更新平衡因子
		while (parent != nullptr){
			if (cur == parent->_right) ++parent->_balance_factor;
			else --parent->_balance_factor;

			if(parent->_balance_factor == 0) break;
			else if (abs(parent->_balance_factor) == 1) {
				cur = parent;
				parent = parent->_parent;
			}
			else if (abs(parent->_balance_factor) == 2) {
				//需要旋转
				if (parent->_balance_factor == 2 && cur->_balance_factor == 1) {
					rotate_left(parent);
				}
				else if (parent->_balance_factor == -2 && cur->_balance_factor == -1) {
					rotate_right(parent);
				}
				else if (parent->_balance_factor == -2 && cur->_balance_factor == 1) {
					rotate_left_right(parent);
				}
				else if (parent->_balance_factor == 2 && cur->_balance_factor == -1) {
					rotate_right_left(parent);
				}
				else assert(false);
				break;
			}
			else {
				assert(false);
			}
		}
		return true;
	}

	void inorder() {
		_inorder(_root);
	}
	bool IsBlance() {
		return _IsBlance(_root);
	}
private:
	void _inorder(TreeNode* root) {
		if (root == nullptr) {
			return;
		}
		_inorder(root->_left);
		cout << root->_data.first << " ";
		_inorder(root->_right);
	}

	bool _IsBlance(TreeNode* root) {
		if (root == nullptr) return true;

		int diff = Height(root->_right) - Height(root->_left);
		if (diff != root->_balance_factor) {
			cout << root->_data.first << "结点的平衡因子异常" << endl;
			return false;
		}

		return abs(diff) < 2 && _IsBlance(root->_left) && _IsBlance(root->_right);
	}
	int Height(TreeNode* root) {
		if (root == nullptr) return 0;
		return max(Height(root->_left),Height(root->_right)) + 1;
	}

	void rotate_left(TreeNode* parent) {
		TreeNode* subR = parent->_right;
		TreeNode* subRL = subR->_left;
		TreeNode* pparent = parent->_parent;

		parent->_right = subRL;
		if (subRL != nullptr) subRL->_parent = parent;
		subR->_left = parent;
		parent->_parent = subR;

		//解决根结点变换带来的问题
		if (_root == parent) {
			_root = subR;
			subR->_parent = nullptr;
		}
		else {
			if (pparent->_left == parent) pparent->_left = subR;
			else pparent->_right = subR;
			subR->_parent = pparent;
		}
		subR->_balance_factor = parent->_balance_factor = 0;
	}

	void rotate_right(TreeNode* parent) {
		TreeNode* subL = parent->_left;
		TreeNode* subLR = subL->_right;
		TreeNode* pparent = parent->_parent;

		parent->_left = subLR;
		if (subLR != nullptr) subLR->_parent = parent;
		subL->_right = parent;
		parent->_parent = subL;

		if (_root == parent) {
			_root = subL;
			subL->_parent = nullptr;
		}
		else {
			if (pparent->_left == parent) pparent->_left = subL;
			else pparent->_right = subL;
			subL->_parent = pparent;
		}
		subL->_balance_factor = parent->_balance_factor = 0;
	}

	void rotate_left_right(TreeNode* parent) {
		TreeNode* subL = parent->_left;
		TreeNode* subLR = subL->_right;
		int bf = subLR->_balance_factor;

		rotate_left(parent->_left);
		rotate_right(parent);

		//更新平衡因子
		subLR->_balance_factor = 0;
		if (bf == 1) {
			parent->_balance_factor = 0;
			subL->_balance_factor = -1;
		}
		else if (bf == -1) {
			parent->_balance_factor = 1;
			subL->_balance_factor = 0;
		}
		else if (bf == 0) {
			parent->_balance_factor = 0;
			subL->_balance_factor = 0;
		}
		else assert(false);
	}

	void rotate_right_left(TreeNode* parent) {
		TreeNode* subR = parent->_right;
		TreeNode* subRL = subR->_left;
		int bf = subRL->_balance_factor;

		rotate_right(parent->_right);
		rotate_left(parent);

		subRL->_balance_factor = 0;
		if (bf == 1) {
			parent->_balance_factor = -1;
			subR->_balance_factor = 0;
		}
		else if (bf == -1) {
			parent->_balance_factor = 0;
			subR->_balance_factor = 1;
		}
		else if (bf == 0) {
			parent->_balance_factor = 0;
			subR->_balance_factor = 0;
		}
		else assert(false);
	}
private:
	TreeNode* _root = nullptr;
};

你可能感兴趣的:(C++,数据结构,算法)