二叉搜索树又称为二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
由于二叉搜索树中,每个结点左子树上所有结点的值都小于该结点的值,右子树上所有结点的值都大于该结点的值,因此对二叉搜索树进行中序遍历后,得到的是升序序列也就不难理解了。
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
a、从根开始比较,查找,比根大则往右边走查找,比根小则往左边走查找。
b、最多查找高度次,走到空,还没找到,这个值不存在。
插入的具体过程如下:
a. 树为空,则直接新增节点,赋值给root指针
b. 树不空,按二叉搜索树性质查找插入位置,插入新节点
首先查找元素是否在二叉搜索树中,如果不存在,则返回, 否则要删除的结点可能分下面四种情况:
a. 要删除的结点无孩子结点
b. 要删除的结点只有左孩子结点
c. 要删除的结点只有右孩子结点
d. 要删除的结点有左、右孩子结点
看起来有待删除节点有4中情况,实际情况a可以与情况b或者c合并起来,因此真正的删除过程如下:
情况b:删除该结点且使被删除节点的双亲结点指向被删除节点的左孩子结点–直接删除
情况c:删除该结点且使被删除节点的双亲结点指向被删除结点的右孩子结点–直接删除
情况d:在被删除的结点的右子树中寻找中序下的第一个结点(关键码最小),用它的值填补到被删除节点中,再来处理该结点的删除问题–替换法删除
要实现二叉搜索树,我们首先需要实现一个结点类:
template<class K>
// 二叉树的结构
struct BSTreeNode {
BSTreeNode<K> *_left; //左孩子指针
BSTreeNode<K> *_right;//右孩子指针
K _key; //结点值
//构造函数
BSTreeNode(const K &key = 0)
: _left(nullptr), _right(nullptr), _key(key) {
}
};
#pragma once
#include
using namespace std;
template<class K>
class BSTree {
typedef BSTreeNode<K> Node;
public:
BSTree() = default;//指定强制生成默认构造
//默认构造
BSTree();
//拷贝构造
BSTree(const BSTree<K> &t);
//赋值重载
BSTree<K> &operator=(BSTree<K> t);
//析构函数
~BSTree();
//插入key值
bool Insert(const K &key);
//查找key值
bool Find(const K &key);
//删除key值
bool Erase(const K &key);
//递归查找
bool FindR(const K &key);
//递归插入
bool InsertR(const K &key);
//递归删除
bool EraseR(const K &key);
//中序遍历
void InOrder();
private:
Node *_root = nullptr;// 二叉搜索树的根
};
//构造一个空树
BSTree()
: _root(nullptr) {
}
拷贝构造函数也并不难,拷贝一棵和所给二叉搜索树相同的树即可。
Node *Copy(Node *root) {
if (root == nullptr) {
return nullptr;
}
//前序遍历copy树
Node *newRoot = new Node(root->_key);
newRoot->_left = Copy(root->_left);
newRoot->_right = Copy(root->_right);
return newRoot;
}
//构造树的深拷贝
BSTree(const BSTree<K> &t) {
_root = Copy(t._root);
}
对于赋值运算符重载函数,下面提供两种实现方法:
传统写法:
//传统写法
const BSTree<K> &operator=(const BSTree<K> &t) {
//避免自己拷贝自己
if (this != &t) {
_root = Copy(t._root);
}
return *this;//为了支持连续赋值
}
现代写法:
//现代写法
BSTree<K> &operator=(BSTree<K> t) {
swap(_root, t._root);
return *this;
}
赋值运算符重载函数的现代写法非常精辟,函数在接收右值时并没有使用引用进行接收,因为这样可以间接调用BSTree
的拷贝构造函数完成拷贝构造。我们只需将这个拷贝构造出来的对象的二叉搜索树与this对象的二叉搜索树进行交换,就相当于完成了赋值操作,而拷贝构造出来的对象t会在该赋值运算符重载函数调用结束时自动析构。
注意:两种方法都是深拷贝,效率并没有什么区别
析构函数完成对象中二叉搜索树结点的释放,注意释放时采用后序释放,当二叉搜索树中的结点被释放完后,将对象当中指向二叉搜索树的指针及时置空即可。
void Destroy(Node *&root) {
if (root == nullptr) {
return;
}
//后序遍历析构
Destroy(root->_left);
Destroy(root->_right);
delete root;
root = nullptr;
}
//析构函数
~BSTree() {
Destroy(_root);
}
根据二叉搜索树的特性,我们在二叉搜索树当中查找指定值的结点的方式如下:
// 查找
bool Find(const K &key) {
Node *cur = _root;
while (cur) {
if (key > cur->_key) {
cur = cur->_right;
} else if (key < cur->_key) {
cur = cur->_left;
} else {
return true;
}
}
return false;
}
bool _FindR(Node *root, const K &key) {
if (root == nullptr) {
return false;
}
if (root->_key == key) {
return true;
}
if (key > root->_key) {
return _FindR(root->_right, key);
} else {
return _FindR(root->_left, key);
}
}
bool FindR(const K &key) {
return _FindR(_root, key);
}
根据二叉搜索树的性质,其插入操作非常简单:
如果是空树,则直接将插入结点作为二叉搜索树的根结点。
如果不是空树,则按照二叉搜索树的性质进行结点的插入。
若不是空树,插入结点的具体操作如下:
如此进行下去,直到找到与待插入结点的值相同的结点判定为插入失败,或者最终插入到某叶子结点的左右子树当中(即空树当中)。
使用非递归方式实现二叉搜索树的插入函数时,我们需要定义一个parent指针,该指针用于标记待插入结点的父结点。这样一来,当我们找到待插入结点的插入位置时,才能很好的将待插入结点与其父结点连接起来。
但是需要注意在连接parent和cur时,需要判断应该将cur连接到parent的左边还是右边。
bool Insert(const K &key) {
// 如果根一开始就为nullptr,那么就直接构建初始的根
if (_root == nullptr) {
_root = new Node(key);
return true;
}
// 如果_root不为nullptr,那么就从根开始遍历,找适合的位置
Node *parent = nullptr;// parent跟着cur遍历找到合适的位置,充当插入的父亲节点
Node *cur = _root;
while (cur) {
//key < cur->_key 需要走左子树
//key > cur->_key 需要走右子树
if (key < cur->_key) {
parent = cur; //记录父亲结点
cur = cur->_left;//走左树
} else if (key > cur->_key) {
parent = cur;
cur = cur->_right;//走右数
} else {
// 如果key == cur->_key 那么就直接返回false,二叉搜索树的值不允许相同
return false;
}
}
// 找到后就开始链接
cur = new Node(key);
// 这里不知道cur最终走到了parent的左边还是右边,所以还要进行判断
// key>parent->_key 链接右树
// key_key 链接左树
if (key > parent->_key) {
parent->_right = cur;//右树
} else if (key < parent->_key) {
parent->_left = cur;//左树
}
return true;
}
递归实现二叉搜索树的插入操作也是很简单的,但是要特别注意的一点就是,递归插入函数的子函数接收参数root时,必须采用引用接收,因为只有这样我们才能将二叉树当中的各个结点连接起来。
bool _InsertR(Node *&root, const K &key) {
if (root == nullptr) {
root = new Node(key);
return root;
}
if (key > root->_key) {
return _InsertR(root->_right, key);
} else if (key < root->_key) {
return _InsertR(root->_left, key);
} else {
return false;
}
}
二叉搜索树的删除函数是最难实现的,若是在二叉树当中没有找到待删除结点,则直接返回false表示删除失败即可,但若是找到了待删除结点,此时就有以下三种情况:
下面我们分别对这三种情况进行分析处理:
1、待删除结点的左子树为空
若待删除结点的左子树为空,那么当我们在二叉搜索树当中找到该结点后,只需先让其父结点指向该结点的右孩子结点,然后再将该结点释放便完成了该结点的删除,进行删除操作后仍保持二叉搜索树的特性。
2、待删除结点的右子树为空
若待删除结点的右子树为空,那么当我们在二叉搜索树当中找到该结点后,只需先让其父结点指向该结点的左孩子结点,然后再将该结点释放便完成了该结点的删除,进行删除操作后仍保持二叉搜索树的特性。
3、待删除结点的左右子树均不为空
若待删除结点的左右子树均不为空,那么当我们在二叉搜索树当中找到该结点后,可以使用替换法进行删除。
可以将让待删除结点左子树当中值最大的结点,或是待删除结点右子树当中值最小的结点代替待删除结点被删除(下面都以后者为例),然后将待删除结点的值改为代替其被删除的结点的值即可。而代替待删除结点被删除的结点,必然左右子树当中至少有一个为空树,因此删除该结点的方法与前面说到的情况一和情况二的方法相同。
注意只能是待删除结点左子树当中值最大的结点,或是待删除结点右子树当中值最小的结点代替待删除结点被删除,因为只有这样才能使得进行删除操作后的二叉树仍保持二叉搜索树的特性。
// 删除
bool Erase(const K &key) {
Node *parent = nullptr;
Node *cur = _root;
while (cur) {
if (key > cur->_key) {
parent = cur;
cur = cur->_right;
} else if (key < cur->_key) {
parent = cur;
cur = cur->_left;
} else {
// 开始删除
// 1.如果要删除的cur左边是nullptr,那么我们就进行判断,判断cur在parent的左子树还是右子树,
// 如果是左子树,那么就由parent的left指向cur的右子树,如果是右子树,就由parent的right指向cur的右子树
if (cur->_left == nullptr) {
// if (parent == nullptr)
if (cur == _root) {
_root = cur->_right;
} else {
if (parent->_left == cur) {
parent->_left = cur->_right;
} else {
parent->_right = cur->_right;
}
}
delete cur;
} else if (cur->_right == nullptr) {// 2.cur的右边为nullptr
// if (parent == nullptr)
if (cur == _root) {
_root = cur->_left;
} else {
if (parent->_left == cur) {
parent->_left = cur->_left;
} else {
parent->_right = cur->_left;
}
}
delete cur;
} else {
// 都不为nullptr,替代法,用被删除的cur的左子树的最大节点,右子树的最大节点替换
// 找cur右子树的最大节点
Node *pminRight = cur;
Node *minRight = cur->_right;
// 找右子树,右子树的最小位置在右子树的左边
while (minRight->_left) {
pminRight = minRight;
minRight = minRight->_left;
}
// 找到最小的值赋值给cur
cur->_key = minRight->_key;
// pminRight->_left==minRight 那么左边已经是最小了,所以minRight的左子树肯定为空了
// 那么可能minRight还有右子树,所以需要pinRight来领养
if (pminRight->_left == minRight) {
pminRight->_left = minRight->_right;
} else {
// 如果不是,比如删除根节点,那么就需要将pminRight->_right指向minRight->right(最小值左边一定为NULL。不需要领养)
//minRight是其父结点的右孩子
pminRight->_right = minRight->_right;
}
delete minRight;
}
return true;
}
}
return false;
}
递归实现二叉搜索树的删除函数的思路如下:
bool _EraseR(Node *&root, const K &key) {
if (root == nullptr)
return false;
if (key > root->_key) {
return _EraseR(root->_right, key);
} else if (key < root->_key) {
return _EraseR(root->_left, key);
} else {
Node *del = root;
//开始准备删除,root谁上层root->_left/_right的引用
if (root->_right == nullptr) {
//root是上层的左右子树
root = root->_left;
} else if (root->_left == nullptr) {
root = root->_right;
} else {
Node *maxleft = root->_left;
//找最大,最大在右边
while (maxleft->_right) {
maxleft = maxleft->_right;
}
swap(root->_key, maxleft->_key);
//转换在子树去删除
//这里不能传maxleft,maxleft是局部变量
return _EraseR(root->_left, key);
}
delete del;
return true;
}
}
//BSTree.h
#pragma once
#include
using namespace std;
template<class K>
// 二叉树的结构
struct BSTreeNode {
BSTreeNode<K> *_left; //左孩子指针
BSTreeNode<K> *_right;//右孩子指针
K _key; //结点值
//构造函数
BSTreeNode(const K &key = 0)
: _left(nullptr), _right(nullptr), _key(key) {
}
};
template<class K>
class BSTree {
typedef BSTreeNode<K> Node;
public:
BSTree() = default;//指定强制生成默认构造
//默认构造,构造一个空树
//构造树的深拷贝
BSTree(const BSTree<K> &t) {
_root = Copy(t._root);
}
//传统写法
const BSTree<K> &operator=(const BSTree<K> &t) {
//避免自己拷贝自己
if (this != &t) {
_root = Copy(t._root);
}
return *this;//为了支持连续赋值
}
//现代写法,接收一个t的拷贝,临时对象,然后进行交换
BSTree<K> &operator=(BSTree<K> t) {
swap(_root, t._root);
return *this;
}
//析构函数
~BSTree() {
Destroy(_root);
}
bool Insert(const K &key) {
// 如果根一开始就为nullptr,那么就直接构建初始的根
if (_root == nullptr) {
_root = new Node(key);
return true;
}
// 如果_root不为nullptr,那么就从根开始遍历,找适合的位置
Node *parent = nullptr;// parent跟着cur遍历找到合适的位置,充当插入的父亲节点
Node *cur = _root;
while (cur) {
//key < cur->_key 需要走左子树
//key > cur->_key 需要走右子树
if (key < cur->_key) {
parent = cur; //记录父亲结点
cur = cur->_left;//走左树
} else if (key > cur->_key) {
parent = cur;
cur = cur->_right;//走右数
} else {
// 如果key == cur->_key 那么就直接返回false,二叉搜索树的值不允许相同
return false;
}
}
// 找到后就开始链接
cur = new Node(key);
// 这里不知道cur最终走到了parent的左边还是右边,所以还要进行判断
// key>parent->_key 链接右树
// key_key 链接左树
if (key > parent->_key) {
parent->_right = cur;//右树
} else if (key < parent->_key) {
parent->_left = cur;//左树
}
return true;
}
// 查找
bool Find(const K &key) {
Node *cur = _root;
while (cur) {
if (key > cur->_key) {
cur = cur->_right;
} else if (key < cur->_key) {
cur = cur->_left;
} else {
return true;
}
}
return false;
}
// 删除
bool Erase(const K &key) {
Node *parent = nullptr;
Node *cur = _root;
while (cur) {
if (key > cur->_key) {
parent = cur;
cur = cur->_right;
} else if (key < cur->_key) {
parent = cur;
cur = cur->_left;
} else {
// 开始删除
// 1.如果要删除的cur左边是nullptr,那么我们就进行判断,判断cur在parent的左子树还是右子树,
// 如果是左子树,那么就由parent的left指向cur的右子树,如果是右子树,就由parent的right指向cur的右子树
if (cur->_left == nullptr) {
// if (parent == nullptr)
if (cur == _root) {
_root = cur->_right;
} else {
if (parent->_left == cur) {
parent->_left = cur->_right;
} else {
parent->_right = cur->_right;
}
}
delete cur;
} else if (cur->_right == nullptr) {// 2.cur的右边为nullptr
// if (parent == nullptr)
if (cur == _root) {
_root = cur->_left;
} else {
if (parent->_left == cur) {
parent->_left = cur->_left;
} else {
parent->_right = cur->_left;
}
}
delete cur;
} else {
// 都不为nullptr,替代法,用被删除的cur的左子树的最大节点,右子树的最大节点替换
// 找cur右子树的最大节点
Node *pminRight = cur;
Node *minRight = cur->_right;
// 找右子树,右子树的最小位置在右子树的左边
while (minRight->_left) {
pminRight = minRight;
minRight = minRight->_left;
}
// 找到最小的值赋值给cur
cur->_key = minRight->_key;
// pminRight->_left==minRight 那么左边已经是最小了,所以minRight的左子树肯定为空了
// 那么可能minRight还有右子树,所以需要pinRight来领养
if (pminRight->_left == minRight) {
pminRight->_left = minRight->_right;
} else {
// 如果不是,比如删除根节点,那么就需要将pminRight->_right指向minRight->right(最小值左边一定为NULL。不需要领养)
//minRight是其父结点的右孩子
pminRight->_right = minRight->_right;
}
delete minRight;
}
return true;
}
}
return false;
}
bool _FindR(Node *root, const K &key) {
if (root == nullptr) {
return false;
}
if (root->_key == key) {
return true;
}
if (key > root->_key) {
return _FindR(root->_right, key);
} else {
return _FindR(root->_left, key);
}
}
Node *Copy(Node *root) {
if (root == nullptr) {
return nullptr;
}
//前序遍历copy树
Node *newRoot = new Node(root->_key);
newRoot->_left = Copy(root->_left);
newRoot->_right = Copy(root->_right);
return newRoot;
}
void Destroy(Node *&root) {
if (root == nullptr) {
return;
}
//后序遍历析构
Destroy(root->_left);
Destroy(root->_right);
delete root;
root = nullptr;
}
bool FindR(const K &key) {
return _FindR(_root, key);
}
bool _InsertR(Node *&root, const K &key) {
if (root == nullptr) {
root = new Node(key);
return root;
}
if (key > root->_key) {
return _InsertR(root->_right, key);
} else if (key < root->_key) {
return _InsertR(root->_left, key);
} else {
return false;
}
}
bool InsertR(const K &key) {
return _InsertR(_root, key);
}
bool _EraseR(Node *&root, const K &key) {
if (root == nullptr)
return false;
if (key > root->_key) {
return _EraseR(root->_right, key);
} else if (key < root->_key) {
return _EraseR(root->_left, key);
} else {
Node *del = root;
//开始准备删除,root谁上层root->_left/_right的引用
if (root->_right == nullptr) {
//root是上层的左右子树
root = root->_left;
} else if (root->_left == nullptr) {
root = root->_right;
} else {
Node *maxleft = root->_left;
//找最大,最大在右边
while (maxleft->_right) {
maxleft = maxleft->_right;
}
swap(root->_key, maxleft->_key);
//转换在子树去删除
//这里不能传maxleft,maxleft是局部变量
return _EraseR(root->_left, key);
}
delete del;
return true;
}
}
bool EraseR(const K &key) {
return _EraseR(_root, key);
}
// 一般调用为t.InOrder() 不传参数,所以这里进行了封装
void InOrder() {
_InOrder(_root);
cout << endl;
}
void _InOrder(Node *root) {
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << " ";
_InOrder(root->_right);
}
private:
Node *_root = nullptr;// 二叉搜索树的根
};
测试代码:
#include "BSTree.h"
void test_BStree1() {
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
BSTree<int> t;
for (auto e: a) {
t.Insert(e);
}
t.Erase(7);
t.Erase(14);
t.Erase(3);
t.Erase(8);
t.InOrder();
}
void test_BSTree2() {
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
BSTree<int> t;
for (auto e: a) {
t.InsertR(e);
}
t.EraseR(7);
t.EraseR(14);
t.EraseR(3);
t.EraseR(8);
t.EraseR(6);
t.InOrder();
}
void test_BSTree3() {
int a[] = {8, 3, 1, 10, 6, 4, 7, 14, 13};
BSTree<int> t1;
for (auto e: a) {
t1.InsertR(e);
}
t1.InOrder();
BSTree<int> t2(t1);
t2.InOrder();
}
int main() {
test_BSTree3();
return 0;
}
K模型:K模型即只有key作为关键码,结构中只需要存储Key即可,关键码即为需要搜索到的值。
比如:给一个单词word,判断该单词是否拼写正确,具体方式如下:
以词库中所有单词集合中的每个单词作为key,构建一棵二叉搜索树
在二叉搜索树中检索该单词是否存在,存在则拼写正确,不存在则拼写错误。
KV模型:每一个关键码key,都有与之对应的值Value,即
比如英汉词典就是英文与中文的对应关系,通过英文可以快速找到与其对应的中文,英文单词与其对应的中文**
再比如统计单词次数,统计成功后,给定单词就可快速找到其出现的次数**,单词与其出现次数就是就构成一种键值对。**
KV结构的二叉搜索树:
#include
#include
using namespace std;
// 改造二叉搜索树为KV结构s
template<class K, class V>
struct BSTNode {
BSTNode(const K &key = K(), const V &value = V())
: _pLeft(nullptr), _pRight(nullptr), _key(key), _Value(value) {}
BSTNode<K, V> *_pLeft;
BSTNode<K, V> *_pRight;
K _key;
V _value
};
template<class K, class V>
class BSTree {
typedef BSTNode<K, V> Node;
typedef Node *PNode;
public:
BSTree() : _pRoot(nullptr) {}
PNode Find(const K &key);
bool Insert(const K &key, const V &value);
bool Erase(const K &key);
private:
PNode _pRoot;
};
void TestBSTree3() {
// 输入单词,查找单词对应的中文翻译
BSTree<string, string> dict;
dict.Insert("string", "字符串");
dict.Insert("tree", "树");
dict.Insert("left", "左边、剩余");
dict.Insert("right", "右边");
dict.Insert("sort", "排序");
// 插入词库中所有单词
string str;
while (cin >> str) {
BSTNode<string, string> *ret = dict.Find(str);
if (ret == nullptr) {
cout << "单词拼写错误,词库中没有这个单词:" << str << endl;
} else {
cout << str << "中文翻译:" << ret->_value << endl;
}
}
}
void TestBSTree4() {
// 统计水果出现的次数
string arr[] = {"苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜",
"苹果", "香蕉", "苹果", "香蕉"};
BSTree<string, int> countTree;
for (const auto &str: arr) {
// 先查找水果在不在搜索树中
// 1、不在,说明水果第一次出现,则插入<水果, 1>
// 2、在,则查找到的节点中水果对应的次数++
//BSTreeNode* ret = countTree.Find(str);
auto ret = countTree.Find(str);
if (ret == NULL) {
countTree.Insert(str, 1);
} else {
ret->_value++;
}
}
countTree.InOrder();
}
插入和删除操作都必须先查找,查找效率代表了二叉搜索树中各个操作的性能。
对有n个结点的二叉搜索树,若每个元素查找的概率相等,则二叉搜索树平均查找长度是结点在二叉搜索树的深度的函数,即结点越深,则比较次数越多。 但对于同一个关键码集合,如果各关键码插入的次序不同,可能得到不同结构的二叉搜索树:
最优情况下,二叉搜索树为完全二叉树(或者接近完全二叉树),其平均比较次数为:LogN
最差情况下,二叉搜索树退化为单支树(或者类似单支),其平均比较次数为:N/2
问题:如果退化成单支树,二叉搜索树的性能就失去了。那能否进行改进,不论按照什么次序插入关键码,二叉搜索树的性能都能达到最优?答案就是使用AVL树和红黑树