红黑树一种数据结构,效率极高,插入和删除的操作的时间复杂度都是logn,虽然红黑树对于前端来说基本很少用到,但是作为一个目标是全栈的程序员来说,算法的学习是很必要的,so … 图是"借的",字都是自己打的,也依据了自己的理解
数组特点是元素在内存中紧挨着存储,因而优点是定位快(O(1)),缺点是插入删除慢(O(n));而链表则不同,它通过指针将不同位置的元素链接起来,因而优缺点与数组正好相反:定位慢(O(n)),插入删除快(O(1))
红黑树是特殊的排序二叉树,所以这里我们先介绍一下排序二叉树, 二叉树相较于二叉树具有以下特性,二叉树内的节点是不能重复的
排序二叉树的时间复杂度在完全平衡情况下为O(lgN),在极端情况下二叉树的时间复杂度为O(N),等于顺序排列的时间复杂度, 所以二叉树的时间复杂度在O(lgN)和O(N)之间,所以我们希望能构造一个比较平衡的二叉树, 这样效率比较稳定
二叉树的平衡与不平衡与插入的顺序有关
HashMap, TreeMap, TreeSet
每节点都是红色或黑色
根节点是黑色
每个叶子节点(就是最末端的节点也就是null)是黑色(一般画图省略null)
如果一个节点是红色,那么它的两个子节点都是黑色(也就是说不能有两个相邻的红色节点)
从任一 节点开始到其所有子孙叶结点的路径中所包含的黑色结点数量必须相同。
这里要阐明一个概念,从根节点到叶节点的包含的黑色节点的数量(不包括根节点)就是棵树的黑色高度, 例如上面这棵树的黑色高度就是
由此可知, 红黑树的任一节点到其叶节点的路径最长路径不超过最短路径的两倍,这就是相当于使用近似的平衡
简单的来说,就是能够保证二叉树的的每条分支的长度差不多
这里我们先来看一个图
可以发现同样的数据,可以用两种不同的二叉树来表示, 而这种操作就是红黑树用来平衡二叉树的方式 ,即左旋/右旋 , 当然还有变色
左旋
右旋
因为相同元素的二叉树不是一个固定的结构,所每个节点都可以对他进行左旋右旋的操作,这样操作之后仍旧能保持二叉树的性质, 而红黑树让我们在插入和删除的过程中为了保证红黑的性质, 做左旋右旋或者变色的调整,从而保持红黑树的平衡
在插入之前,我们首先规定插入的节点颜色都为红色 ,因为(从任一 节点开始到其所有子孙叶结点的路径中所包含的黑色结点数量必须相同)这条规定,如果我们插入了黑色节点很容易就破坏了规定
下面我们想一下,在插入一个红色节点的时候会发生哪些情况,我们一一分析
插入的节点的位置为根节点, 直接涂黑就行了,根节点为黑色
插入位置父节点是一个黑色节点,显然这种情况我们不需要调整
插入的位置父节点是一个红色节点, 这时候就需要调整了,以为两个红色连在一起会违背规定4 ,这里分成三种情况
在了解删除之前,我们首先需要知道的的是一个节点的前驱和后继是什么 , 简单来说就是离这个节点数字最近的两个数字节点
这里举个例子,以17为例子,他的前驱就是16后驱就是19
这时我们需要删除17这个节点,就可以把他的前驱或者后继放到他的位置上来位置二叉树结构, 这样就相当于我们只是删除了前驱(后继)上的节点, 这有什么用呢,因为前驱和后继的情况比较简单,前驱只能有左节点,后继只能有右节点,当前驱和后继被当成替死鬼之后, 子节点直接被当成备胎提来
这里为了方便解释,我们将删除后新生成的树的各个角色标记
这里我们也将删除分成几种情况
被删除的节点是红色, 不需要平衡不影响黑色数量
N节点为红色,只要直接变成红色就好了
被删除的节点是黑色,N也是黑色(下面可以分为这几种)
**操作: 直接将S变成红色,这时P节点下的整个树都比其他分支少一个黑色节点,这时我们把P看成一个新的N节点来处理,向上重新来平衡树**
**操作: 将P变成黑,S变成红, 这时经过S的分支数量没有变化, N这边刚好多了一个平衡了**
**操作: 以P左旋,P和S颜色互换,SR改为黑色,经过N的多了一个P, 经过SL的不变,SR因为自己变黑了所以也不变**
**操作: 以S节点右旋转,交换S和SL颜色, 这样的旋转不会改变S各分支的黑色数量,这时由于SL原来是红色,所以他的左子节点必定是黑色, 所以我们可以发现这种情况与上面的情况4相同,按照上面的方法来平衡**
**操作: 以P为点,左旋转, 交换P和S的颜色, 这是N所处的情况就是P为红,兄弟为黑的情况了,可以参照2,3,4具体情况处理**
总结
总的来说红黑树就是通过旋转变色,来维持整个红黑二叉树的平衡,最终保证不管添加了多少各节点, 最长分支不会超过最短分支的两倍长度,这样能保证每次操作的效率都是比较稳定的 .
但是这种树并不是非常平衡,当然还存在一种AVL树, 是一种完全平衡树, 分支之间节点数量不能差超过一个节点,但是这样势必会增加平衡的操作,得不偿失. 红黑树的插入平衡次数最多两次, 删除最多平衡三次 , AVl树插入删除的复杂度都是log(N),但是在查询是效率是要高于红黑树的
说了这么多红黑树的平衡,其实讲道理基本看的时候理解了,到这里忽然有失忆了,我觉得学习红黑树并不是要背下来是如何处理的,是要去了解平衡过程中的思路,顺带膜拜膜拜大佬们的思想,到底是怎么想出这个东西的!