替罪羊树

平衡树,是平衡的二叉排序树,精确地说,是有一定限度下的平衡。在信息学竞赛中平衡树是一个相当重点的数据结构,而绝大多数的平衡树都是需要旋转的。比如说AVL树和红黑树是两个要在节点上附带信息的带旋转平衡树,这两种平衡树效果不错,但是写起来有点麻烦(貌似AVL树有六种情况需要旋转,红黑树中的删除操作似乎有更多的旋转情况),而SBT(Size Balanced Tree,子树大小平衡树)虽然写起来挺简单的,但是仍然有所缺陷。除了这种完全宽松平衡的平衡树之外,还有像Treap和Splay两种类型,这两种类型在信息学竞赛中比较常用,Treap依赖于给节点赋上一些满足堆性质的随机值,而Splay则依赖于“伸展”操作。虽然这两种平衡树不一定完全平衡,但是对于大多数情况是够用了。虽然Splay在面对有序数据的时候会退化成链,但是在对于某些序列的动态处理问题上几乎完美。
暂且搁置掉这些数据结构,我们来考虑一下另一种平衡树。首先,我们要定义“平衡”的概念。如果一个二叉搜索树节点 x ,对于某个 0.5α1 满足 size(left(x))αsize(x) size(right(x))αsize(x) ,即这个节点的两棵子树包含的节点数都不超过整一棵子树的 α 倍,那么就称这个节点 x α -大小平衡的。另外,如果我们记 h(T) 为一棵树 T 的高度(即叶节点到根节点的最长链的长度),以及 hα(n)=log1/αn ,那么当 h(T)hα(size(T)) 的时候,我们称这棵树 T α 高度平衡的。直观上讲,如果一棵树的高度不大于与这棵树同样大小的 α -权重平衡的最高的树,那么这棵树是 α -高度平衡的。从另一个角度说,一棵 α -权重平衡的树,也必然是一棵 α -高度平衡的树。实际上,替罪羊树并不是完全 α -高度平衡的,而是宽松 α -高度平衡的,也就是说,总满足 h(T)hα(size(T))+1
然后,我们先定义拍扁重建。什么是拍扁重建呢?就是将一堆节点直接重建为最平衡的二叉树,具体操作就是先将这棵子树全部“拍扁”成一个有序序列,然后递归地不断取中点为根节点,然后将剩下来的左右两端序列继续递归地重建并作为这个根节点的左右儿子。
接着,和普通的二叉搜索树一样,但是在每次操作之后都稍微检查一下,从操作的节点位置一路往上找,如果找到某一个节点满足以这个节点为根的子树不满足宽松 α -高度平衡,那么就直接拍扁重建第一个遇到的就好了(也就是直接重建深度最深的那一个)。
然后,我们来分析替罪羊树的各项修改操作的复杂度。很容易看出,我们分析时只能用均摊的方式去分析,那么这里先采用势能分析。容易发现,一个大小为 size 的子树,只有被再插入 Ω(size) 个节点的时候才会被整体地重构(即不算其孩子的单独重构)。而且,重构的代价也显然是 O(size) 的,那么当我们每插入一个节点时,就给它的所有祖先都先添上 1 的势能,那么每棵子树在重构的时候,其的根节点上就会有足够的势能去重建了,因此所有操作的均摊时间复杂度就是 Ω(δ+d) ,其中 δ 是原本的代价,而 d 是相应的操作节点的深度。由于拍扁重建的平衡性质以及宽松 α -高度平衡条件,我们同样可以证明到整棵树的高度不会超过 log1/an+1 ,那么所有基础操作(比如插入、删除、查找),就都是 Ω(logn) 的了。

这里顺便留一个小想法:Splay树的思想是否有可能和替罪羊树结合起来,使得利用一定的“部分重建”,改善Splay树的时间复杂度?替罪羊树的高度始终是不算高的,而Splay的功能却很强大,那能不能有什么方法,修改一下其的势能函数,来分析一下结合后的均摊代价呢?这样是否能够进一步地改进出一个强大的序列查找工具呢?

你可能感兴趣的:(数据结构)