二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
注意:空树可以是任意类型的树,所以空树也是一棵二叉搜索树
对于搜索二叉树的所有操作我们均以下面数组a中的数据为例:
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
节点的定义和普通二叉树节点的定义一样,但是二叉搜索树节点的值我们习惯用key 来表示,类中我们只需要一个根节点即可:
// 定义节点
template<class K>
struct BSTreeNode
{
BSTreeNode<K>* _left;
BSTreeNode<K>* _right;
K _key;
BSTreeNode(const K& key)
:_key(key)
,_left(nullptr)
,_right(nullptr)
{}
};
// 二叉搜索树
template<class K>
class BSTree
{
typedef BSTreeNode<K> Node;
public:
// ......
private:
Node* _root;
构造函数我们将_root置为nullptr即可:
// 构造
BSTree()
:_root(nullptr)
{}
拷贝构造的时候,我们需要一个一个节点的进行拷贝,可以使用先序递归的方式进行拷贝,这里需要注意的是,在一个类中成员函数的第一个参数是this指针,所以我们递归的时候就无法传递根节点,所以我们这里需要写一个copy的子函数,在拷贝构造函数中调用即可
代码如下:
// 拷贝构造
BSTree(const BSTree<K>& t)
{
_root = Copy(t._root);
}
Node* copy(Node* root)
{
if (root == nullptr)
return;
Node* newRoot = new Node(root->_key);
copy(root->_left);
copy(root->_right);
return newRoot;
}
赋值重载的时候我们交换两棵树的根节点即可:
// 赋值重载
BSTree<K>& operator=(BSTree<K> t)
{
swap(_root, t._root);
return *this;
}
析构函数和拷贝构造函数一样,需要一个一个节点的进行递归删除,也需要写一个Destory函数来帮我们完成删除节点
// 析构函数
~BSTree()
{
Destory(_root);
_root = nullptr;
}
void Destory(Node* root)
{
if (root == nullptr)
return;
Destory(root->_left);
Destory(root->_right);
delete root;
}
中序遍历和拷贝构造和析构函数一样,需要写一个子函数去帮我们完成:
// 中序遍历
void InOrder()
{
_InOrder(_root);
cout << endl;
}
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << " ";
_InOrder(root->_right);
}
【总结】在一个类中,需要写递归的时候,此时就需要写一个子函数去帮我们完成
查找思路:
1.从根开始比较查找,如果比根大则往右边走查找,比根小则往左边走查找。
2.最多查找高度次,如果走到到空,还没找到,这个值不存在。
代码实现:
// 查找节点
bool Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
return true;
}
}
//cur为空还没有找到说明没有这个节点
return false;
}
插入思路:
1.如果根为空,则直接将新增节点作为根节点
2.如果根不为空,则先查找插入的位置–比根大就往右边走,比根的值小就往左边走,直到找到为空的位置,然后进行插入
3.在查找插入位置的过程中,如果遇到和要插入的节点的key值相等的时候直接返回false,这是因为K模型中不允许出现冗余节点(key值相同的节点)
注意:在遍历查找插入位置的过程中,我们需要记录父节点的位置,这样在我们找到插入位置的时候才能将节点链接到二叉搜索树中
// 插入节点
bool Insert(const K& key)
{
// 树为空
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
// 保存当前节点的父节点
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
// key的值比cur的值大,cur就往右子树走
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
// key的值比cur的值小,cur就往左子树走
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
// 相等就返回false
else
{
return false;
}
}
cur = new Node(key);
// 比parent的key值小就在左子树
if (parent->_key > key)
{
parent->_left = cur;
}
// 比parent的key值大就在右子树
else
{
parent->_right = cur;
}
return true;
}
删除思路:
1.首先查找元素是否在二叉搜索树中,如果不存在,则返回false,否则要删除的结点可能分下面四种情况:
a. 要删除的结点无孩子结点
b. 要删除的结点只有左孩子结点
c. 要删除的结点只有右孩子结点
d. 要删除的结点有左、右孩子结点
看起来有待删除节点有4中情况,实际情况a可以与情况b或者c合并起来,因此真正的删除过程如下:
情况b:删除该结点且使被删除节点的双亲结点指向被删除节点的左孩子结点–直接删除
情况c:删除该结点且使被删除节点的双亲结点指向被删除结点的右孩子结点–直接删除
情况d:在它的右子树中寻找中序下的第一个结点(关键码最小),用它的值填补到被删除节点中,再来处理该结点的删除问题–替换法删除
也就是说,我们要删除的节点为叶子节点,此时我们只需要让父节点的left/right指向空,然后delete叶子节点即可,当要删除的节点只有左孩子或者只有右孩子,此时我们需要将该节点的子节点托孤给父节点,然后再delete该节点,当要删除的节点左右孩子均不为空,此时我们需要先将该节点与左子树的最大/右子树的最小节点进行交换,然后再delete被替换的最大节点或者最小节点
上面的三种情况对应着下面图中四个元素删除的情况:
为什么替换删除时需要找左子树的最大节点或者右子树的最小节点?
这是由二叉搜索树的性质决定的,二叉搜索树的左孩子小于根节点,右孩子大于根节点,所以左子树的最大节点一定大于当前节点的其余左节点,小于当前节点的所有右子树节点,那么将它替换掉当前节点后二叉搜索树仍然能保证二叉树搜索树的结构–左子树节点的值小于根节点,右子树节点的值大于根节点,选左子树的最小节点原理同前所述
我们以上图中的8为例,8的左子树的最大节点为7,将8替换为7后,7的左子树的节点均小于7,右子树的节点均大于7,8的右子树的大小节点为10,将8替换为10之后,左子树的节点均小于10,右子树的节点均大于10
代码如下:
// 删除节点
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
// 一共有如下三种情况
// 1、左为空
// 2、右为空
// 3、左右都不为空,替换删除
// 1、左为空
if (cur->_left == nullptr)
{
// 删除的节点是根节点,并且根的左子树为空
if (cur == _root)
{
_root = cur->_right;
}
// cur是parent的左子树,那么将cur的右子树给parent的左子树
else if (parent->_left == cur)
{
parent->_left = cur -> _right;
}
// cur是parent的右子树,那么将cur的右子树给parent的右子树
else
{
parent->_right = cur->_right;
}
delete cur;
}
// 2、右为空
else if (cur->_right == nullptr)
{
// 删除的节点是根节点,并且根的右子树为空,左子树不为空
if (cur == _root)
{
_root = cur->_left;
}
// cur是parent的左子树,那么将cur的左子树给parent的左子树
else if (parent->_left == cur)
{
parent->_left = cur->_left;
}
// cur是parent的右子树,那么将cur的左子树给parent的右子树
else
{
parent->_right = cur->_left;
}
delete cur;
}
// 3、左右都不为空,替换删除
else
{
// 找右树最小节点
Node* parent = cur;
Node* minRight = cur->_right;
while (minRight->_left)
{
parent = minRight;
minRight = minRight->_left;
}
// 交换minRight的key和cur的key
cur->_key = minRight->_key;
// minRight是parent的左子树,将minRight的右子树给parent的左子树,因为minRight的左子树为空
if (minRight == parent->_left)
{
parent->_left = minRight->_right;
}
// minRight是parent的左子树,将minRight的右子树给parent的右子树,因为minRight的左子树为空
else
{
parent->_right = minRight->_right;
}
delete minRight;
}
return true;
}
}
// 没有找到删除的节点返回false
return false;
}
二叉搜索树的插入,查找,删除还可以使用递归的方式来实现,虽然我们说,只要能写成循环就不要写成递归,因为函数调用需要建立栈帧,递归调用如果深度太深栈帧的开销就会很大,但是这里使用递归的时候,引用做参数设计的十分巧妙,解决了父节点链接子节点的问题
// 递归查找
bool FindR(const K& key)
{
return _FindR(_root, key);
}
bool _FindR(Node* root, const K& key)
{
if (root == nullptr)
return false;
if (root->_key > key)
return _FindR(root->_left, key);
else if (root->_key < key)
return _FindR(root->_right, key);
else
return true;
}
// 递归插入
bool InsertR(const K& key)
{
return _InsertR(_root,key);
}
bool _InsertR(Node*& root, const K& key)
{
if (root == nullptr)
{
// root是父节点的别名,直接链接即可
root = new Node(key);
return true;
}
if (root->_key < key)
return _InsertR(root->_right, key);
else if (root->_key > key)
return _InsertR(root->_left, key);
else
return false;
}
// 递归删除
bool EraseR(const K& key)
{
return _EraseR(_root, key);
}
bool _EraseR(Node*& root, const K& key)
{
if (root == nullptr)
return false;
if (root->_key > key)
{
return _EraseR(root->_left, key);
}
else if (root->_key < key)
{
return _EraseR(root->_right, key);
}
else
{
Node* del = root;
if (root->_left == nullptr)
{
root = root->_right;
}
else if (root->_right == nullptr)
{
root = root->_left;
}
else
{
Node* minRight = root->_right;
while (minRight->_left)
{
minRight = minRight->_left;
}
swap(root->_key, minRight->_key);
// 转换成在子树中去删除节点
return _EraseR(root->_right, key);
}
delete del;
return true;
}
}
注意:递归实现的时候我们不需要使用替换删除,我们可以直接交换两个节点,然后再递归删除即可
#pragma once
namespace K
{
// 定义节点
template<class K>
struct BSTreeNode
{
BSTreeNode<K>* _left;
BSTreeNode<K>* _right;
K _key;
BSTreeNode(const K& key)
:_key(key)
,_left(nullptr)
,_right(nullptr)
{}
};
template<class K>
class BSTree
{
typedef BSTreeNode<K> Node;
public:
// 构造
BSTree()
:_root(nullptr)
{}
// 拷贝构造
BSTree(const BSTree<K>& t)
{
_root = Copy(t._root);
}
// 赋值重载
BSTree<K>& operator=(BSTree<K> t)
{
swap(_root, t._root);
return *this;
}
~BSTree()
{
Destory(_root);
_root = nullptr;
}
// 插入节点
bool Insert(const K& key)
{
// 树为空
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
// 保存当前节点的父节点
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
// key的值比cur的值大,cur就往右子树走
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
// key的值比cur的值小,cur就往左子树走
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
// 相等就返回false
else
{
return false;
}
}
cur = new Node(key);
// 比parent的key值小就在左子树
if (parent->_key > key)
{
parent->_left = cur;
}
// 比parent的key值大就在右子树
else
{
parent->_right = cur;
}
return true;
}
// 查找节点
bool Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
return true;
}
}
return false;
}
// 删除节点
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
// 一共有如下三种情况
// 1、左为空
// 2、右为空
// 3、左右都不为空,替换删除
// 1、左为空
if (cur->_left == nullptr)
{
// 删除的节点是根节点,并且根的左子树为空
if (cur == _root)
{
_root = cur->_right;
}
// cur是parent的左子树,那么将cur的右子树给parent的左子树
else if (parent->_left == cur)
{
parent->_left = cur -> _right;
}
// cur是parent的右子树,那么将cur的右子树给parent的右子树
else
{
parent->_right = cur->_right;
}
delete cur;
}
// 2、右为空
else if (cur->_right == nullptr)
{
// 删除的节点是根节点,并且根的右子树为空,左子树不为空
if (cur == _root)
{
_root = cur->_left;
}
// cur是parent的左子树,那么将cur的左子树给parent的左子树
else if (parent->_left == cur)
{
parent->_left = cur->_left;
}
// cur是parent的右子树,那么将cur的左子树给parent的右子树
else
{
parent->_right = cur->_left;
}
delete cur;
}
// 3、左右都不为空,替换删除
else
{
// 找右树最小节点
Node* parent = cur;
Node* minRight = cur->_right;
while (minRight->_left)
{
parent = minRight;
minRight = minRight->_left;
}
// 交换minRight的key和cur的key
cur->_key = minRight->_key;
// minRight是parent的左子树,将minRight的右子树给parent的左子树,因为minRight的左子树为空
if (minRight == parent->_left)
{
parent->_left = minRight->_right;
}
// minRight是parent的左子树,将minRight的右子树给parent的右子树,因为minRight的左子树为空
else
{
parent->_right = minRight->_right;
}
delete minRight;
}
return true;
}
}
// 没有找到删除的节点返回false
return false;
}
// 中序遍历
void InOrder()
{
_InOrder(_root);
cout << endl;
}
// 递归插入
bool InsertR(const K& key)
{
return _InsertR(_root,key);
}
// 递归查找
bool FindR(const K& key)
{
return _FindR(_root, key);
}
// 递归删除
bool EraseR(const K& key)
{
return _EraseR(_root, key);
}
private:
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << " ";
_InOrder(root->_right);
}
Node* copy(Node* root)
{
if (root == nullptr)
return;
Node* newRoot = new Node(root->_key);
copy(root->_left);
copy(root->_right);
return newRoot;
}
void Destory(Node* root)
{
if (root == nullptr)
return;
Destory(root->_left);
Destory(root->_right);
delete root;
}
bool _InsertR(Node*& root, const K& key)
{
if (root == nullptr)
{
root = new Node(key);
return true;
}
if (root->_key < key)
return _InsertR(root->_right, key);
else if (root->_key > key)
return _InsertR(root->_left, key);
else
return false;
}
bool _FindR(Node* root, const K& key)
{
if (root == nullptr)
return false;
if (root->_key > key)
return _FindR(root->_left, key);
else if (root->_key < key)
return _FindR(root->_right, key);
else
return true;
}
bool _EraseR(Node*& root, const K& key)
{
if (root == nullptr)
return false;
if (root->_key > key)
{
return _EraseR(root->_left, key);
}
else if (root->_key < key)
{
return _EraseR(root->_right, key);
}
else
{
Node* del = root;
if (root->_left == nullptr)
{
root = root->_right;
}
else if (root->_right == nullptr)
{
root = root->_left;
}
else
{
Node* minRight = root->_right;
while (minRight->_left)
{
minRight = minRight->_left;
}
swap(root->_key, minRight->_key);
// 转换成在子树中去删除节点
return _EraseR(root->_right, key);
}
delete del;
return true;
}
}
private:
Node* _root;
};
}
#include
using namespace std;
#include "BSTree.h"
void TestBSTree1()
{
int a[] = { 8, 3, 1, 10, 6, 4, 7, 14, 13 };
K::BSTree<int> t;
for (auto e : a)
{
t.InsertR(e);
}
t.InOrder();
t.EraseR(14);
t.InOrder();
t.EraseR(3);
t.InOrder();
t.EraseR(8);
t.InOrder();
for (auto e : a)
{
t.EraseR(e);
t.InOrder();
}
}
int main()
{
TestBSTree1();
return 0;
}
插入和删除操作都必须先查找,查找效率代表了二叉搜索树中各个操作的性能。二叉搜索树的最主要的功能就是进行查找,由于二叉树搜索树结构的特性,进行查找时每次比较都能直接排除整个左子树/右子树的数据。
对有n个结点的二叉搜索树,若每个元素查找的概率相等,则二叉搜索树平均查找长度是结点在二叉搜索树的深度的函数,即结点越深,则比较次数越多。
但对于同一个关键码集合,如果各关键码插入的次序不同,可能得到不同结构的二叉搜索树:
最优情况下,二叉搜索树为完全二叉树(或者接近完全二叉树),其平均比较次数为:O(lonN)
最差情况下,二叉搜索树退化为单支树(或者类似单支),其平均比较次数为:O(N)
所以二叉搜索树的查找效率为O(N)
可能我们有疑问,既然二叉搜索树的查找的时间复杂度为O(N),那我们为什么不直接使用二分查找呢,比较二分查找的时间复杂度为O(logN),这样因为二分查找有许多要求:
1.二分查找要求数据必须是有序的
2.二分查找使用顺序表进行数据存储,插入,删除数据的效率低,而在实际的开发中,我们是要经常插入删除数据的
而且只有当数据有序或者接近有序时二叉搜索树的查找的时间复杂度才为O(N),所以大部分情况下查找效率都是远高于O(N)的,此外对于单支的二叉搜索树我们还可以进行改进。
如果退化成单支树,二叉搜索树的性能就失去了。那能否进行改进,不论按照什么次序插入关键码,二叉搜索树的性能都能达到最优?那么我们后续章节学习的AVL树和红黑树就可以上场了。
二叉搜索树主要应用于两种模型—K模型和KV模型,上面我们学习的就是K模型
K模型
K模型即只有key作为关键码,结构中只需要存储Key即可,关键码即为需要搜索到的值。K模型中,K的值不可以修改,下面我们以检查单词拼写是否错误作为K模型的一个具体的应用场景:
给一个单词word,判断该单词是否拼写正确,我们可以以词库中所有单词集合中的每个单词作为key,构建一棵二叉搜索树,在二叉搜索树中检索该单词是否存在,存在则拼写正确,不存在则拼写错误
KV模型
每一个关键码key,都有与之对应的值Value,即
比如英汉词典就是英文与中文的对应关系,通过英文可以快速找到与其对应的中文,英文单词与其对应的中文
再比如统计单词次数,统计成功后,给定单词就可快速找到其出现的次数,单词与其出现次数就是
下面我们将我们之前的K模型的代码简单改造为KV模型,并实现上面的英汉翻译和统计每种类型的水果的数量
KV模型的代码实现:
namespace KV
{
// 定义节点
template<class K,class V>
struct BSTreeNode
{
BSTreeNode<K, V>* _left;
BSTreeNode<K, V>* _right;
K _key;
V _value;
// 构造
BSTreeNode(const K& key,const V& value)
:_left(nullptr)
,_right(nullptr)
,_key(key)
,_value(value)
{}
};
template<class K,class V>
class BSTree
{
typedef BSTreeNode<K, V> Node;
public:
// 插入
bool Insert(const K& key,const V& value)
{
if (_root == nullptr)
{
_root = new Node(key, value);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else
{
return false;
}
}
cur = new Node(key, value);
if (parent->_key < cur->_key)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
return true;
}
// 查找
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
//中序遍历
void InOrder()
{
_InOrder(_root);
}
void _InOrder(Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << ":" << root->_value << endl;
_InOrder(root->_right);
}
private:
Node* _root = nullptr;
};
}
英汉翻译:
void TestBSTree2()
{
// 统计水果出现的次数
string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
// 词库中单词都放进这个搜索树中
// Key的搜索模型,判断在不在?
// 场景:检查单词拼写是否正确/车库出入系统/...
//K::BSTree dict;
// Key/Value的搜索模型,通过Key查找或修改Value
KV::BSTree<string, string> dict;
dict.Insert("sort", "排序");
dict.Insert("string", "字符串");
dict.Insert("left", "左边");
dict.Insert("right", "右边");
string str;
while (cin >> str)
{
KV::BSTreeNode<string, string>* ret = dict.Find(str);
if (ret)
{
cout << ret->_value << endl;
}
else
{
cout << "无此单词" << endl;
}
}
}
统计水果出现的次数
void TestBSTree3()
{
// 统计水果出现的次数
string arr[] = { "苹果", "西瓜", "香蕉", "草莓","苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
KV::BSTree<string, int> countTree;
for (auto e : arr)
{
auto* ret = countTree.Find(e);
if (ret == nullptr)
{
countTree.Insert(e, 1);
}
else
{
ret->_value++;
}
}
countTree.InOrder();
}