1.并查集
并查集充分利用“擒贼先擒王”的思想,执行合并和查找操作。
(1)合并
如果两个元素的集合号不同,将两个元素合并为一个集合。注意:合并时只需要把一个元素的祖宗集合号,改为另一个元素的祖宗集合号。擒贼先擒王,只改祖宗即可!
(2)查找
查找两个元素所在的集合,即找祖宗。注意:查找时,采用递归的方法找其祖宗,祖宗集合号等于本身时即停止。在回归时,把当前节点到祖宗路径上的所有节点统一为祖宗的集合号。
2.优先队列
如果从序列中顺序搜索找最小值则需要O(n)的时间,而使用优先队列找最小值则只需要O(logn)的时间。优先队列是利用堆来实现的,队头元素为最大值使用的是最大堆,反之为最小堆。首先构建初始堆(优先队列),然后进行出队和入队操作。
出队:堆顶出队,最后一个记录代替堆顶的位置,重新调整为堆。
入队:新记录放入最后一个记录之后,重新调整为堆。
重新调整为堆需要掌握两个基本操作:“下沉”和“上浮”。
“下沉”:堆顶与左右孩子比较,如果比孩子大,则已调整为堆;如果比孩子小,则与较大的孩子交换,交换到新的位置后,继续向下比较,从根节点一直比较到叶子。
“上浮”:新记录与其双亲比较,如果小于等于双亲,则已调整为堆;如果比双亲大,则与双亲交换,交换到新的位置后,继续向上比较,从叶子一直比较到根。
3.B-树
B-树具有平衡、有序、多路的特点。B-树中,所有的叶子都在最后一层,因此左右子树的高差为0,体现了平衡的特性。B-树具有中序有序的特性,即左子树<根<右子树。多路是指可以有多个分支,m阶B-树中的节点最多可以有m个分支,所以也可以称为m路平衡搜索树。一棵含有n个关键字的m阶B-树最大高度为O(logm_n_),B-树的查找、插入、删除等基本操作与树高成正比关系。
(1)查找
B-树的查找和二叉搜索树的查找类似,不同的是需要从外存调入节点,然后在节点内查找(一个节点可能包含多个关键字)。
(2)插入
由于B-树根节点至少有一个关键字和两棵子树,其它非终端节点关键字个数范围为[m/2−1,m−1]。插入一个新的关键字,有可能使节点的关键字个数超出上限m−1,发生“上溢”。将该关键字分裂操作:取V节点中间的关键字k_s__(_s =m/2),将k_s__上升到其父节点_P,左右两部分作为k_s的左右孩子。分裂操作将上溢节点的中间关键字ks_上升到其父节点,如果其父节点这时也发生上溢,则继续分裂操作,一直向上传递,最远到达树根。特殊情况,上溢一直传递到树根,树根也发生上溢,那么将树根分裂,根节点的中间关键字分裂成为新的树根,修复完成,此时树的高度增1。
(3)删除
删除一个关键字,有可能使节点的关键字个数低于下限m/2−1,发生“下溢”。考察下溢节点V的左右兄弟,下溢处理分为3种情况:左借、右借、合并。
4.B+树
B+树是B-树的变种,更适用于文件索引系统。从严格定义上,B+树已经不属于树,因为叶子之间有连接,树是不允许同层节点有连接的。一棵m根节点阶B+树,至少有两个关键字,其它非终端节点关键字个数范围为[m/2,m],关键字个数等于子树个数,而B-树关键字个数比子树个数少一个。
(1)查找
B+树支持两种方式的查找,可以利用t指针从树根向下索引查找,也可以利用r指针从最小关键字向后顺序查找。每次查找都要走一条从树根到叶子的路径,时间复杂度为树高O(logm_n_)。
(2)插入
m阶B+树的插入,仅在最后一层节点插入,因为除了最后一层节点,其他非终端节点都表示索引。又因为m阶B+树的关键字个数要求不超过m,如果插入后节点的关键字个数超过m,则发生上溢,需要分裂操作。只不过分裂时,和B-树的分裂不同,上升到父节点的关键字,子节点中仍然保留。
(3)删除
如果关键字个数小于m/2时发生下溢。如果发生下溢则需要像B-树那样左借、右借或合并操作解除下溢。解除下溢时要特别注意父节点中的最大关键字更新。
5.红黑树
红黑树也是一种平衡二叉搜索树,在AVL树“适度平衡”的基础上,进一步放宽条件,红黑树的左右子树高度不超过两倍。红黑树在插入和删除等操作时,不需要频繁调整平衡,任何不平衡都可以在3次旋转之内解决,因此红黑树在很多地方广泛应用。
红黑树查找、插入和删除的速度与树高成线性正比,因此红黑树查找、插入和删除的时间复杂度为O(logn)。红黑树的查找和二叉搜索树一样。红黑树的插入、删除操作中,必须维护红黑树的5个性质,性质1、3很容易满足,需要特别维护性质2、4、5,即根为黑色,红节点必有黑孩子,左右子树黑高相同。
(1)插入
在红黑树中插入x,首先通过查找,在查找失败的位置创建x节点,并置红色(如果为树根,则置黑色)。如果新插入节点x的父亲为红色,则出现“双红”,此时需要修正,使其满足红黑树的条件。
(2)删除
在红黑树中删除x,首先通过查找找到x的位置,然后判断处理:如果x节点仅有左子树(或右子树),则删除x节点,令其左子树(或右子树)子承父业代替其位置。如果x节点有左子树和右子树,则令x的直接前驱(或直接后继)代替其位置,然后删除其直接前驱(或直接后继)即可。在删除节点的过程中,有可能违反红黑树的性质2、4、5,即根为黑色,红节点必有黑孩子,左右子树黑高相同。简而言之,根为黑、无“双红”、左右子树黑高相等。
本文截选自最新上架的《趣学数据结构》
适读人群 :本书可作为程序员的学习用书,也适合没有太多编程经验但又对数据结构有强烈兴趣的初学者使用,同时也可作为高等院校计算机、数学及相关专业的师生用书,或学科竞赛的辅导用书和培训学校的教材。