动画 | 什么是二分搜索树(二叉查找树)?

二分搜索树属性

二分搜索树的又名比较多,有的叫二叉排序树,也有的叫二叉查找树,或者有序二叉查找树。是指一棵空树或者具有下列性质的二叉树:

1.若任意节点的左子树不空,则左子树所有节点的值均小于它根节点的值;

2.若任意节点的右子树不空,则右子树所有节点的值均小于它根节点的值;

3.任意节点的左、右子树也分别为二叉查找树;

4.没有键值相等的节点。

它的查找、插入和删除的时间复杂度都等于树高,期望值是O(logn),最坏时间复杂度是O(n),比如树退化成线性表。

(响应读者的建议,视频动画不放BGM了)

动画

算法动画视频 地址

查找元素

二分搜索树是为了实现快速查找而生的,也支持快速添加和删除一个数据。如何查找某个元素首先跟根节点去做比较,如果相等的话就返回;如果待查元素要比根节点小,就进行左子树递归查找;如果待查元素要比根节点大,就进行右子树的递归查找;如果查找到最后还没有一个符合的元素,就返回null。

递归查找

递归查找的方式有很多,有层序遍历、前序遍历、中序遍历和后序遍历。我这里就举后面三个遍历方式。

Code

如果代码是下面这样写的,那它遍历过程是怎么样的?看下面视频动画。

视频动画:前序遍历

算法动画视频 地址

视频动画:前中后遍历

算法动画视频 地址

视频动画:前中后遍历 前序

算法动画视频 地址

视频动画:前中后遍历 中序

算法动画视频 地址

经过中序遍历得到的正好是一个升序序列。

视频动画:前中后遍历 后序

算法动画视频 地址

如果不考虑升序,后序遍历能够为二分搜索树早点释放内存。

添加元素

对于二叉树的添加和删除元素,使用链表存储形式比较好操作的,如果使用数组形式存储,删除某一个有子树的元素会引发一系列的位置改变,涉及到交换元素的位置,性能也比链表的小。所以待会后面出现的伪代码都以链表存储形式去操作。

视频动画:添加元素

算法动画视频 地址

Code

删除元素:删除最小和最大的元素

删除最小和最大的元素很简单,如果是删除最小的元素,从二叉树的顶点出发,一直递归它的左孩子,直到某节点的左孩子为空,这时候这个节点就是最小的元素。删除最大的元素也是一样的,一直递归它的右孩子,直到某节点的右孩子为空。

视频动画:删除最小和最大的元素

算法动画视频 地址

删除任意元素

如果删除任意元素,而这元素正好有左右子树的,那该是怎么般呢?

1962年,Hibbard提出了Hibbard Deletion的解决方法。

看到Hibbard名字就想起来,我在希尔排序介绍过Hibbard增量序列,也把它相应的公式通过代码体现出来,代替希尔增量序列去进行希尔排序,最坏时间复杂度也比希尔增量序列的要小。

回到删除有左右子树的元素,想想它的左右子树也属于二叉排序树(也是二分搜索树),它左子树的最大值比它小,它右子树的最小值比它大。所以不管选择左子树的最大值还是选择右子树的最小值,替换掉要删除的元素,整个二叉树都是符合二分搜索树的规则。

视频动画:删除任意元素

算法动画视频 地址

Code

支持重复元素的二分搜索树

二分搜索树有一个规则是:没有键值相等的节点。那么就不建议把待添加的元素跳过值相等的节点,到下一步继续比较直到插入新的节点。比如我想插入23,插完之后上有23,下有23,那查找就没有意义了,也破坏了时间复杂度上的O(logn)。

建议就是在节点上加一个属性:count。当插入23的时候,count就可以自算++。这不仅满足了没有键值相等的规则,也满足时间复杂度的期望值。

Code

喜欢本文的朋友,微信搜索「算法无遗策」公众号,收看更多精彩的算法动画文章

你可能感兴趣的:(大数据)