二叉搜索树,又称为二叉排序树,是一种特殊的二叉树。它要么是一棵空树,要么具有以下性质:
二叉搜索树的特点是可以快速地查找、插入和删除节点,因为它的节点按照大小关系排列,形成了一种有序结构。它常被用于实现关联数组、集合等数据结构,也是许多其他算法的基础。
二叉搜索树的查找可以通过以下步骤进行:
从根节点开始比较,将待查找的值与根节点的值进行比较,如果相等,则返回该节点;如果待查找的值比根节点的值大,则往右子树走查找,反之则往左子树走查找。
重复上述步骤,直到找到待查找的值或者走到空节点仍未找到。如果走到空节点仍未找到,则说明该值不存在于二叉搜索树中。
由于二叉搜索树的节点按照大小关系排列,因此查找的时间复杂度为O(log n),其中n为二叉搜索树中节点的个数。
二叉搜索树的插入可以通过以下步骤进行:
如果二叉搜索树为空,则直接将新节点作为根节点,赋值给root指针。
如果二叉搜索树不为空,则按照二叉搜索树的性质,从根节点开始比较待插入节点的值和当前节点的值的大小关系,如果待插入节点的值比当前节点的值小,则往左子树走查找,如果左子树为空,则将待插入节点作为当前节点的左子节点;
如果待插入节点的值比当前节点的值大,则往右子树走查找,如果右子树为空,则将待插入节点作为当前节点的右子节点。
如果待插入节点的值与当前节点值相等,表示已经存在这个值,插入失败。
重复上述步骤,直到找到合适的插入位置为止。
二叉搜索树的插入时间复杂度为O(log n),其中n为二叉搜索树中节点的个数。
二叉搜索树的删除可以通过以下步骤进行:
首先查找待删除的节点是否在二叉搜索树中,如果不存在,则直接返回;否则,进入下一步操作。
根据待删除节点的情况,进行以下处理:
如果待删除节点是叶子节点,则直接删除该节点即可。
如果待删除节点只有左子树或者右子树,则将待删除节点的父节点指向待删除节点的子节点,然后删除待删除节点。
如果待删除节点既有左子树又有右子树,则需要找到它的中序遍历下的后继节点(即右子树中的最小节点),将后继节点的值赋给待删除节点,然后将待删除节点的右指向后继节点的右,然后删除后继节点。
重复上述步骤,直到完成待删除节点的删除。
需要注意的是,二叉搜索树的删除操作可能会影响树的结构,因此需要对树进行平衡操作,以保证二叉搜索树的性质不被破坏。
二叉搜索树的删除时间复杂度为O(log n),其中n为二叉搜索树中节点的个数。
template<class k>
class BStreeNode
{
public:
BStreeNode(const k& key)
:_key(key), _left(nullptr), _right(nullptr)
{}
k _key;
BStreeNode* _left;
BStreeNode* _right;
};
二叉搜索树节点的定义有以下成员:
key:表示节点的关键码,用于比较节点的大小关系,通常是一个模板类型,可以是整型、字符型、字符串、自定义类型等。
left:表示节点的左子节点,通常是一个指向BStreeNode类型的指针,如果节点没有左子节点,则该指针为空指针nullptr。
right:表示节点的右子节点,通常是一个指向BStreeNode类型的指针,如果节点没有右子节点,则该指针为空指针nullptr。
template<class k>
class BStree
{
typedef BStreeNode<k> Node;
public:
Node* find(const k& key);
bool insert(const k& key);
bool erase(const k& key);
void InOrder();
private:
Node* _root = nullptr;
void _InOrder(const Node* root);
};
二叉搜索树的定义包括以下成员:
Node:表示二叉树的节点,通常是一个模板类,包括节点的关键码、左子节点、右子节点等成员。
find():用于在二叉树中查找指定关键码的节点,如果找到,则返回该节点的指针;否则返回空指针nullptr。
insert():用于向二叉树中插入一个新节点,如果插入成功,则返回true;否则返回false。
erase():用于从二叉树中删除指定关键码的节点,如果删除成功,则返回true;否则返回false。
InOrder():用于对二叉树进行中序遍历,按照节点的关键码从小到大输出节点的值。
Node* find(const k& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
cur = cur->_right;
else if (cur->_key > key)
cur = cur->_left;
else
return cur;
}
return nullptr;
}
二叉搜索树的查找操作可以通过比较节点的键值来实现。从根节点开始,若当前节点的键值小于要查找的键值,则继续在右子树中查找;若当前节点的键值大于要查找的键值,则继续在左子树中查找;若当前节点的键值等于要查找的键值,则返回当前节点。
上述代码实现了二叉搜索树的查找操作。从根节点开始,通过循环遍历整棵树,比较节点的键值,根据大小关系移动到左子树或右子树中,直到找到要查找的节点或遍历到叶子节点为止。如果找到了要查找的节点,则返回该节点指针;否则返回空指针。
bool insert(const k& key)
{
//空树
if (_root == nullptr)
{
Node* newnode = new Node(key);
_root = newnode;
return true;
}
//不为空
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
parent = cur;
if (cur->_key < key)
cur = cur->_right;
else if (cur->_key > key)
cur = cur->_left;
else
return false;
}
Node* newnode = new Node(key);
parent->_key > key ? parent->_left = newnode : parent->_right = newnode;
return true;
}
二叉搜索树的插入操作可以通过比较节点的键值来实现。从根节点开始,若要插入的键值小于当前节点的键值,则继续在左子树中插入;若要插入的键值大于当前节点的键值,则继续在右子树中插入;若要插入的键值等于当前节点的键值,则返回插入失败。
上述代码实现了二叉搜索树的插入操作。首先判断树是否为空,如果为空,则直接将新节点作为根节点;否则,从根节点开始循环遍历整棵树,比较节点的键值,根据大小关系移动到左子树或右子树中,直到找到合适的插入位置或遍历到叶子节点为止。如果找到了合适的插入位置,则创建新节点并插入到该位置;否则返回插入失败。
bool erase(const k& key)
{
//查找该节点及其父亲节点
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
break;
}
if (cur == nullptr)
return false;
//为叶子节点
else if (cur->_left == nullptr && cur->_right == nullptr)
delete cur;
//只有一个孩子
else if ((cur->_left == nullptr && cur->_right) || (cur->_left && cur->_right == nullptr))
{
if (parent->_left == cur)
{
cur->_left == nullptr ? parent->_left = cur->_right : parent->_left = cur->_left;
}
else
{
cur->_left == nullptr ? parent->_right = cur->_right : parent->_right = cur->_left;
}
delete cur;
}
//有两个孩子
else if (cur->_left && cur->_right)
{
Node* del = cur->_right;
//找右子树最小节点
while (del->_left)
{
del = del->_left;
}
//赋值
cur->_key = del->_key;
//待删除节点的右指向最小节点右
cur->_right = del->_right;
//删除最小节点
delete del;
}
return true;
}
二叉搜索树的删除操作比较复杂,需要考虑删除节点的情况分为三种:
待删除节点为叶子节点:直接删除该节点即可。
待删除节点只有一个孩子:将该节点的孩子节点接到该节点的父节点上,然后删除该节点。
待删除节点有两个孩子:找到该节点的右子树中的最小节点,将其键值赋值给待删除节点,然后删除最小节点。
上述代码实现了二叉搜索树的删除操作。首先从根节点开始循环遍历整棵树,查找待删除节点及其父节点。如果没有找到待删除节点,则返回删除失败;否则根据待删除节点的情况进行不同的操作。如果待删除节点为叶子节点,则直接删除该节点;如果待删除节点只有一个孩子,则将孩子节点接到父节点上,然后删除该节点;如果待删除节点有两个孩子,则找到右子树中的最小节点,将其键值赋值给待删除节点,然后删除最小节点。最后返回删除成功。
void _InOrder(const Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << ' ';
_InOrder(root->_right);
}
二叉搜索树的中序遍历是指按照节点键值的大小关系,先遍历左子树,再遍历根节点,最后遍历右子树。因为二叉搜索树的中序遍历结果是一个有序序列,因此可以使用中序遍历来实现对二叉搜索树的排序操作。
上述代码实现了二叉搜索树的中序遍历操作。首先判断当前节点是否为空,如果为空则返回;否则按照左子树、根节点、右子树的顺序递归遍历整棵树,并输出节点的键值。
K模型:K模型是指只有key作为关键码,结构中只需要存储Key即可,关键码即为需要搜索的值。例如,可以以词库中所有单词集合中的每个单词作为key,构建一棵二叉搜索树,在二叉搜索树中检索该单词是否存在,存在则拼写正确,不存在则拼写错误。
KV模型:KV模型是指每一个关键码key都有与之对应的值Value,即
将上述二叉搜索树修改为KV模型:
template<class K, class V>
class BStreeNode
{
public:
BStreeNode(const K& key, const V& value)
:_key(key), _value(value), _left(nullptr), _right(nullptr)
{}
K _key;
V _value;
BStreeNode* _left;
BStreeNode* _right;
};
void _InOrder(const Node* root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
cout << root->_key << ":" << root->_value << endl;
_InOrder(root->_right);
}
void test1()
{
BStree<string, string> tree;
tree.insert("apple", "苹果");
tree.insert("banana", "香蕉");
tree.insert("orange", "橘子");
tree.insert("peach", "桃子");
tree.insert("pear", "梨");
tree.InOrder();
}
运行结果:
插入和删除操作都需要先进行查找操作,因此二叉搜索树的查找效率代表了二叉搜索树各个操作的性能。对于有n个节点的二叉搜索树,如果每个元素查找的概率相等,那么二叉搜索树的平均查找长度是节点在二叉搜索树的深度的函数,即节点越深,则比较次数越多。
需要注意的是,对于同一个关键码集合,如果各关键码插入的次序不同,可能会得到不同结构的二叉搜索树。因为二叉搜索树的结构取决于插入顺序,如果插入的顺序不同,可能会导致树的结构不同,进而影响树的查找效率。因此,在实际应用中,需要根据实际情况选择合适的插入顺序,以获得更好的性能。
最优情况下,二叉搜索树的高度为 log2N,每一次查找可以将搜索范围缩小一半,因此平均比较次数为 log2N。
最差情况下,二叉搜索树的高度为 (N-1),每一次查找只能将搜索范围缩小一层,因此平均比较次数为 (1+2+…+N)/N = (N+1)/2,约等于 N/2。这种情况发生在插入的数据是有序的时候,导致二叉搜索树退化为链表。此时可以使用平衡二叉树来解决这个问题。
二叉搜索树是一种非常常见的数据结构,它是一棵二叉树,其中每个节点都包含一个键值,且左子树的所有节点的键值小于当前节点的键值,右子树的所有节点的键值大于当前节点的键值。这种特定的结构使得二叉搜索树能够快速地进行查找、插入、删除等操作。
在实际应用中,二叉搜索树被广泛使用,如在数据库索引、编译器符号表、路由表等领域。对于一个包含n个节点的二叉搜索树,其查找、插入、删除的时间复杂度均为O(logn),这使得它在处理大数据量时具有很高的效率。
但是,二叉搜索树也存在一些问题。当数据集合中的元素是随机分布的时,二叉搜索树的性能是非常好的。但是,当数据集合中的元素是有序的时,二叉搜索树的性能会退化为O(n),这就是所谓的“不平衡问题”。为了解决这个问题,我们可以使用平衡二叉树、红黑树等数据结构来优化二叉搜索树。
此外,二叉搜索树在插入重复元素时也存在问题。如果我们简单地将重复元素插入到二叉搜索树中,那么查找和删除操作就会变得非常麻烦。为了解决这个问题,我们可以使用多重集合、哈希表等数据结构来处理重复元素。
总之,二叉搜索树是一种非常重要的数据结构,它能够快速地进行查找、插入、删除等操作,但是在实际应用中需要注意避免和解决一些问题,如不平衡问题、重复元素问题等。
文章总结不易,如果觉得有所帮助的话就,文中所有代码均放在gitee上,关注博主,持续更新中…