专注前端与算法的系列干货分享,欢迎关注(¬‿¬):
「微信公众号:心谭博客」| xin-tan.com | GitHub
选择数据结构的核心在于解决问题,而不是为了使用而使用。
由于二叉搜索树的定义和特性,它可以高效解决以下问题:
ceil
、floor
、找到第 n 大的元素、找到指定元素在排序好的数组的位置 等等值得一提的是,除了遍历算法,上述各种问题的算法时间复杂度都是 : O ( log 2 n ) O(\log_2 n) O(log2n)
二叉搜索树是一颗空树,或者具有以下性质的二叉树:
需要注意的是,二叉搜索树不一定是一颗完全二叉树,因此,二叉搜索树不能用数组来存储。
第 3 部分实现的测试代码地址:https://gist.github.com/dongyuanxin/d0803a8821c6797e9ce8522a676cf44b。
这是 Github 的 GIST,请自备梯子。
借助struct
和指针模拟树的结构,并且将其封装到BST
这个类之中:
// BST.h
// Created by godbmw.com on 2018/9/27.
//
#ifndef BINARYSEARCH_BST_H
#define BINARYSEARCH_BST_H
#include
#include
using namespace std;
template <typename Key, typename Value>
class BST {
private:
struct Node {
Key key;
Value value;
Node *left;
Node *right;
Node(Key key, Value value) {
this->key = key;
this->value = value;
this->left = NULL;
this->right = NULL;
}
Node(Node* node) {
this->key = node->key;
this->value = node->value;
this->left = node->left;
this->right = node->right;
}
};
Node *root;
int count;
public:
BST() {
this->root = NULL;
this->count = 0;
}
~BST() {
this->destroy(this->root);
}
int size() {
return this->count;
}
bool isEmpty() {
return this->root == NULL;
}
};
#endif //BINARYSEARCH_BST_H
插入采取递归的写法,思路如下:
private:
Node* insert(Node* node, Key key, Value value) {
if(node == NULL) {
count++;
return new Node(key, value);
}
if(key == node->key) {
node->value = value;
} else if( key < node->key) {
node->left = insert(node->left, key, value);
} else {
node->right = insert(node->right, key, value);
}
return node;
}
public:
void insert(Key key, Value value) {
this->root = this->insert(this->root, key, value);
}
查找包含 2 个函数:contain
和search
。前者返回布尔型,表示树中是否有这个节点;后者返回指针类型,表示树中节点对应的值。
search
为什么返回值的指针类型呢:
NULL
。Node*
,就破坏了类的封装性。原则上,内部数据结构不对外展示。private:
bool contain(Node* node, Key key) {
if(node == NULL) {
return false;
}
if(key == node->key) {
return true;
} else if(key < node->key) {
return contain(node->left, key);
} else {
return contain(node->right, key);
}
}
Value* search(Node* node, Key key) {
if(node == NULL) {
return NULL;
}
if(key == node->key) {
return &(node->value);
} else if (key < node->key) {
return search(node->left, key);
} else {
return search(node->right, key);
}
}
public:
bool contain(Key key) {
return this->contain(this->root, key);
}
// 注意返回值类型
Value* search(Key key) {
return this->search(this->root, key);
}
前序、中序和后序遍历的思路很简单,根据定义,直接递归调用即可。
对于层次遍历,需要借助队列queue
这种数据结构。思路如下:
private:
void pre_order(Node* node) {
if(node != NULL) {
cout<<node->key<<endl;
pre_order(node->left);
pre_order(node->right);
}
}
void in_order(Node* node) {
if(node != NULL) {
in_order(node->left);
cout<<node->key<<endl;
in_order(node->right);
}
}
void post_order(Node *node) {
if(node != NULL) {
post_order(node->left);
post_order(node->right);
cout<<node->key<<endl;
}
}
void level_order(Node* node) {
if(node == NULL) {
return;
}
queue<Node*> q;
q.push(node);
while(!q.empty()) {
Node* node = q.front();
q.pop();
cout<< node->key <<endl;
if(node->left) {
q.push(node->left);
}
if(node->right) {
q.push(node->right);
}
}
}
public:
void pre_order() {
this->pre_order(this->root);
}
void in_order() {
this->in_order(this->root);
}
void post_order() {
this->post_order(this->root);
}
void level_order() {
this->level_order(this->root);
}
为了方便实现,首先封装了获取最小键值和最大键值的两个方法:minimum
和maximum
。
删除节点的原理很简单(忘了什么名字,是一个计算机科学家提出的),思路如下:
为什么第 4 步这样可以继续保持二叉搜索树的性质呢?
显然,右子树的最小节点,能满足小于右子树的所有节点,并且大于左子树的全部节点。
如下图所示,要删除58
这个节点,就应该用59
这个节点替换:
private:
// 寻找最小键值
Node* minimum(Node* node) {
if(node->left == NULL) {
return node;
}
return minimum(node->left);
}
// 寻找最大键值
Node* maximum(Node* node) {
if(node->right == NULL) {
return node;
}
return maximum(node->right);
}
Node* remove_min(Node* node) {
if(node->left == NULL) {
Node* right = node->right;
delete node;
count--;
return right;
}
node->left = remove_min(node->left);
return node;
}
Node* remove_max(Node* node) {
if(node->right == NULL) {
Node* left = node->left;
delete node;
count--;
return left;
}
node->right = remove_max(node->right);
return node;
}
// 删除掉以node为根的二分搜索树中键值为key的节点
// 返回删除节点后新的二分搜索树的根
Node* remove(Node* node, Key key) {
if(node == NULL) {
return NULL;
}
if(key < node->key) {
node->left = remove(node->left, key);
} else if(key > node->key){
node->right = remove(node->right, key);
} else {
// key == node->key
if(node->left == NULL) {
Node* right = node->right;
delete node;
count--;
return right;
}
if(node->right == NULL) {
Node *left = node->left;
delete node;
count--;
return left;
}
// node->right != NULL && node->left != NULL
Node* successor = new Node(minimum(node->right));
count++;
// "count --" in "function remove_min(node->right)"
successor->right = remove_min(node->right);
successor->left = node->left;
delete node;
count--;
return successor;
}
return node;
}
public:
// 寻找最小键值
Key* minimum() {
if(this->count == 0) return NULL;
Node* min_node = this->minimum(this->root);
return &(min_node->key);
}
// 寻找最大键值
Key* maximum() {
if(this->count == 0) return NULL;
Node* max_node = this->maximum(this->root);
return &(max_node->key);
}
void remove_min() {
if(this->root == NULL) {
return;
}
this->root = this->remove_min(this->root);
}
void remove_max() {
if(this->root == NULL) {
return;
}
this->root = this->remove_max(this->root);
}
void remove(Key key) {
this->root = remove(this->root, key);
}
floor
和ceil
floor
和ceil
分别是地板和天花板的意思。在一个数组中,对于指定元素n
,如果数组中存在n
,那么n
的两个值就是它本身;如果不存在,那么分别是距离最近的小于指定元素的值 和 距离最近的大于指定元素的值。
private:
Node* floor(Node* node, Key key) {
if(node == NULL) {
return NULL;
}
// key等于node->key:floor的结果就是node本身
if(node->key == key) {
return node;
}
// key小于node—>key:floor的结果肯定在node节点的左子树
if(node->key > key) {
return floor(node->left, key);
}
// key大于node->key:右子树可能存在比node->key大,但是比key小的节点
// 如果存在上述情况,返回这个被选出来的节点
// 否则,函数最后返回node本身
Node* tmp = floor(node->right, key);
if(tmp != NULL) {
return tmp;
}
return node;
}
Node* ceil(Node* node, Key key) {
if(node == NULL) {
return NULL;
}
if(node->key == key) {
return node;
}
if(node->key < key) {
return ceil(node->right, key);
}
Node* tmp = ceil(node->left, key);
if(tmp != NULL) {
return tmp;
}
return node;
}
public:
Key* floor(Key key) {
Key* min_key = this->minimum();
if(this->isEmpty() || key < *min_key) {
return NULL;
}
// floor node
Node *node = floor(this->root, key);
return &(node->key);
}
Key* ceil(Key key) {
Key* max_key = this->maximum();
if(this->isEmpty() || key > *max_key) {
return NULL;
}
// ceil node
Node* node = ceil(this->root, key);
return &(node->key);
}
第 3 部分实现的测试代码地址:https://gist.github.com/dongyuanxin/759d16e1ce87913ad2f359d49d5f5016。
这是 Github 的 GIST,请自备梯子。
考虑一种数据类型,如果是基本有序的一组数据,一次insert
进入二叉搜索树,那么,二叉搜索树就退化为了链表。此时,上述所有操作的时间复杂度都会退化为 O ( l o g 2 N ) O(log_2 N) O(log2N)。
为了避免这种情况,就有了红黑树等数据结构,来保证树的平衡性:左右子树的高度差小于等于 1。
本篇博客是总结于慕课网的《学习算法思想 修炼编程内功》的笔记,强推强推强推。