作者:写Bug的拉哥 https://www.bilibili.com/read/cv8521754 出处:bilibili
写在前面
二叉树结构一直以来都是数据结构课程中的重点和难点。不论是找工作的笔试面试,还是考研的专业课,二叉树所占的比例都是很大的。
而在原始的二叉树的基础上,有不断演化出了很多其他基于二叉树的结构,例如本教程涉及的哈夫曼树、红黑树,还有线索二叉树、B+树等等。但是不管从二叉树衍生出来的结构多么复杂多变,但是底层对于二叉树结构的理论和操作都是相通的。
所以我们在这一章节中,从最基本的原生二叉树开始,不断进行总结和实践,最终达到理解和掌握原生二叉树和一些比较有代表性的二叉树变种的目的
树是我们计算机中非常重要的一种数据结构,同时使用树这种数据结构,可以描述现实生活中的很多事物,例如家谱、单位的组织架构、等等。
树 是由n(n>=1)个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
树具有以下特点:
实际上在现实生活中,树状结构是十分普遍的。例如在我们的计算机磁盘上存储的文件夹和文件,就能够构成一个文件树结构。其中盘符下存储有文件和文件夹,文件夹下又有子文件和子文件夹,但是文件之下一定不会有其他子文件和子文件夹。
那么将这些结构画成一张图,我们就能够看出他的结构:
通过上面这张图我们可以看出来:
通过盘符或者文件夹,我们只能够向下访问其中的子文件和子文件夹,但是我们不能够从文件夹1直接跳转到文件夹2中去,正如我们不会在D盘中直接访问到C盘是一样的道理;
只有盘符或者文件夹下面才能够下挂子文件和子文件夹,但是文件之下是不能够下挂其他任何结构的;
每一个盘符和文件夹之下都有多个分支,这些分支“开枝散叶”,形成了复杂的分支结构,而这种分支结构在向上看的时候,最终都会回归到盘符这个层面,所以上面这张图,正如同一棵倒置的大树,其树根在上。我们将这种由节点和分支构成,并且节点之间只能够上线联系,不能够左右沟通的结构,称之为树结构。
在上图中 :我们称所有的盘符、文件夹和文件为树结构的节点;而连接节点与节点之间的通路,称之为路径。如果一个节点指向另一个节点(例如文件夹1和文件2的关系),那么我们称上面指出的节点为父节点或者双亲节点(文件夹1);下面被指向的节点为父节点的孩子节点(文件2)。其中,孩子节点简称子节点。
上面我们已经了解了什么是树结构。那么,如果在一棵树中,所有的节点都最多只有两个分支,那么这种特殊的树结构,我们称之为二叉树结构。二叉树形如下图所示:
也就是说,在二叉树中,一个节点要么不具有子节点,如果具有子节点的话,最多只能有两个子节点。
如果我们将上述节点的结构稍加变化,让每一个节点都具有两个指针域,会得到一个什么样的结构呢?
然后我们让其中的每一个指针都指向另一个节点,于是乎我们得到如下图所示的一种结构:
不难看出,上面的两张图之间是等价的。所以同样的,只要我们在单链表节点结构的基础上稍加改造,就能够得到二叉树节点的代码。习惯性的,我们将一个父节点左边的子节点称之为左孩子节点,右边的子节点称之为右孩子节点:
class Node {
Object date; //数据域
Node leftChild; //左孩子节点
Node rightChild; //右孩子节点
}
在学习二叉树结构的时候,为了方便讨论,我们将二叉树结构中的节点类型进行如下分类:
根节点:二叉树最上面的节点,特征是只有子节点,没有父节点。如果我们能够得到一个二叉树结构的根节点,那么相当于得到了整个二叉树结构;
中间节点:如果一个节点既有父节点,又有子节点,那么我们称这种节点为中间节点;
叶子节点:如果一个节点只有父节点,没有任何子节点,那么我们称这种节点为叶子结点。
上述三种节点类型,如图所示:
在许多面试题中,都使用n0、n1、n2分别表示度为0、度为1、度为2的节点的数量,即有0个孩子节点、1个孩子节点、2个孩子节点的节点数量。
在任意一棵二叉树中,这些节点的数量,之间存在如下关系:
n2 = n0 - 1:即度为2的节点总比度为0的节点少1个,也就是说,在任意二叉树中,同时具有左右孩子的节点,总比叶子结点的数量少一个;
从上面的公式我们能够推导出来:n总 = n0 + n1 + n2 = 2n0 + n1 - 1 = n1 + 2n2 + 1,且n1 = n总 - n0 - n2 = n总 - 2n0 + 1 = n总 - 2n2 - 1;
所以,只要我们知道一个二叉树中总的节点个数以及度为0或者度为2的节点数量,就能够推导出其他度的节点的数量。
注意:上面的公式常常出现在各种笔试题当中,所以请各位熟练记忆和掌握上述公式以及各种变形公式及其推导过程
二叉树就是度不超过2的树(每个结点最多有两个子结点)
一个二叉树,如果每一层的结点树都达到最大值,则这个树就是满二叉树。每一层就是 2^k-1
在一个满二叉树中存在如下特性:
满二叉树的节点数量一定是一个奇数,因为从第2层开始,每一层的节点数量都是2的整数倍,所以最后加上根节点,那么节点的数量一定是奇数;
一个具有k层的满二叉树,其节点总数为2^k-1个。这个结论很好推理,实际上就是一个公比为2的等比数列和;
第i层上面的节点数量为2^(i-1)个;
一个k层的满二叉树,其叶子结点数量(也就是最后一层的节点数量)为2^(k-1)个;
如果按照从上到下、从左到右的方式为满二叉树的每一个节点从1开始进行编号,那么满二叉树第k层中的最大编号取值为2^k-1;
满二叉树中,编号为m的节点和其左右孩子节点的编号关系是:
叶子节点只能出现在最下层和次下层,并且最下面一层的结点都集中在该层最左边的若干位置的二叉树。叶子节点从左往右放
用链表实现
根据对图的观察,我们发现二叉树其实就是由一个一个的结点及其之间的关系组成的,按照面向对象的思想,我们设计一个结点类来描述结点这个事物。
package cn.itcast.algorithm.uin.test;
/**
* @author wanglufei
* @description: TODO
* @date 2022/2/17/9:43 PM
*/
public class Node<Key,Value> {
//存储键
public Key key;
//存储值
private Value value;
//记录左子结点
public Node left;
// 记录右子结点
public Node right;
public Node(Key key, Value value, Node left, Node right) {
this.key = key;
this.value = value;
this.left = left;
this.right = right;
}
}
插入方法put实现思想:
如果当前树中没有任何一个结点,则直接把新结点当做根结点使用
如果当前树不为空,则从根结点开始;
如果新结点的key小于当前结点的key,则继续找当前结点的左子结点;
如果新结点的key大于当前结点的key,则继续找当前结点的右子结点;
如果新结点的key等于当前结点的key,则树中已经存在这样的结点,替换该结点的value值即可
查询方法get实现思想:
从根节点开始:
如果要查询的key小于当前结点的key,则继续找当前结点的左子结点;
如果要查询的key大于当前结点的key,则继续找当前结点的右子结点;
如果要查询的key等于当前结点的key,则树中返回当前结点的value。
删除方法delete实现思想:
找到被删除结点;
找到被删除结点右子树中的最小结点minNode
删除右子树中的最小结点
让被删除结点的左子树称为最小结点minNode的左子树,让被删除结点的右子树称为最小结点minNode的右子树
让被删除结点的父节点指向最小结点minNode
完整的代码
package cn.itcast.algorithm.tree;
import cn.itcast.algorithm.linear.Queue;
public class BinaryTree<Key extends Comparable<Key>, Value> {
//记录根结点
private Node root;
//记录树中元素的个数
private int N;
private class Node {
//存储键
public Key key;
//存储值
private Value value;
//记录左子结点
public Node left;
//记录右子结点
public Node right;
public Node(Key key, Value value, Node left, Node right) {
this.key = key;
this.value = value;
this.left = left;
this.right = right;
}
}
//获取树中元素的个数
public int size() {
return N;
}
//向树中添加元素key-value
public void put(Key key, Value value) {
root = put(root, key, value);
}
//向指定的树x中添加key-value,并返回添加元素后新的树
private Node put(Node x, Key key, Value value) {
//如果x子树为空,
if (x==null){
N++;
return new Node(key,value, null,null);
}
//如果x子树不为空
//比较x结点的键和key的大小:
int cmp = key.compareTo(x.key);
if (cmp>0){
//如果key大于x结点的键,则继续找x结点的右子树
x.right = put(x.right,key,value);
}else if(cmp<0){
//如果key小于x结点的键,则继续找x结点的左子树
x.left = put(x.left,key,value);
}else{
//如果key等于x结点的键,则替换x结点的值为value即可
x.value = value;
}
return x;
}
//查询树中指定key对应的value
public Value get(Key key) {
return get(root,key);
}
//从指定的树x中,查找key对应的值
public Value get(Node x, Key key) {
//x树为null
if (x==null){
return null;
}
//x树不为null
//比较key和x结点的键的大小
int cmp = key.compareTo(x.key);
if (cmp>0){
//如果key大于x结点的键,则继续找x结点的右子树
return get(x.right,key);
}else if(cmp<0){
//如果key小于x结点的键,则继续找x结点的左子树
return get(x.left,key);
}else{
//如果key等于x结点的键,就找到了键为key的结点,只需要返回x结点的值即可
return x.value;
}
}
//删除树中key对应的value
public void delete(Key key) {
delete(root, key);
}
//删除指定树x中的key对应的value,并返回删除后的新树
public Node delete(Node x, Key key) {
//x树为null
if (x==null){
return null;
}
//x树不为null
int cmp = key.compareTo(x.key);
if (cmp>0){
//如果key大于x结点的键,则继续找x结点的右子树
x.right = delete(x.right,key);
}else if(cmp<0){
//如果key小于x结点的键,则继续找x结点的左子树
x.left = delete(x.left,key);
}else{
//如果key等于x结点的键,完成真正的删除结点动作,要删除的结点就是x;
//让元素个数-1
N--;
//得找到右子树中最小的结点
if (x.right==null){
return x.left;
}
if (x.left==null){
return x.right;
}
Node minNode = x.right;
while(minNode.left!=null){
minNode = minNode.left;
}
//删除右子树中最小的结点
Node n = x.right;
while(n.left!=null){
if (n.left.left==null){
n.left=null;
}else{
//变换n结点即可
n = n.left;
}
}
//让x结点的左子树成为minNode的左子树
minNode.left = x.left;
//让x结点的右子树成为minNode的右子树
minNode.right = x.right;
//让x结点的父结点指向minNode
x = minNode;
}
return x;
}
//查找整个树中最小的键
public Key min(){
return min(root).key;
}
//在指定树x中找出最小键所在的结点
private Node min(Node x){
//需要判断x还有没有左子结点,如果有,则继续向左找,如果没有,则x就是最小键所在的结点
if (x.left!=null){
return min(x.left);
}else{
return x;
}
}
//在整个树中找到最大的键
public Key max(){
return max(root).key;
}
//在指定的树x中,找到最大的键所在的结点
public Node max(Node x){
//判断x还有没有右子结点,如果有,则继续向右查找,如果没有,则x就是最大键所在的结点
if (x.right!=null){
return max(x.right);
}else{
return x;
}
}
//获取整个树中所有的键
public Queue<Key> preErgodic(){
Queue<Key> keys = new Queue<>();
preErgodic(root, keys);
return keys;
}
//获取指定树x的所有键,并放到keys队列中
private void preErgodic(Node x,Queue<Key> keys){
if (x==null){
return;
}
//把x结点的key放入到keys中
keys.enqueue(x.key);
//递归遍历x结点的左子树
if (x.left!=null){
preErgodic(x.left,keys);
}
//递归遍历x结点的右子树
if (x.right!=null){
preErgodic(x.right,keys);
}
}
//使用中序遍历获取树中所有的键
public Queue<Key> midErgodic(){
Queue<Key> keys = new Queue<>();
midErgodic(root,keys);
return keys;
}
//使用中序遍历,获取指定树x中所有的键,并存放到key中
private void midErgodic(Node x,Queue<Key> keys){
if (x==null){
return;
}
//先递归,把左子树中的键放到keys中
if (x.left!=null){
midErgodic(x.left,keys);
}
//把当前结点x的键放到keys中
keys.enqueue(x.key);
//在递归,把右子树中的键放到keys中
if(x.right!=null){
midErgodic(x.right,keys);
}
}
//使用后序遍历,把整个树中所有的键返回
public Queue<Key> afterErgodic(){
Queue<Key> keys = new Queue<>();
afterErgodic(root,keys);
return keys;
}
//使用后序遍历,把指定树x中所有的键放入到keys中
private void afterErgodic(Node x,Queue<Key> keys){
if (x==null){
return ;
}
//通过递归把左子树中所有的键放入到keys中
if (x.left!=null){
afterErgodic(x.left,keys);
}
//通过递归把右子树中所有的键放入到keys中
if (x.right!=null){
afterErgodic(x.right,keys);
}
//把x结点的键放入到keys中
keys.enqueue(x.key);
}
//使用层序遍历,获取整个树中所有的键
public Queue<Key> layerErgodic(){
//定义两个队列,分别存储树中的键和树中的结点
Queue<Key> keys = new Queue<>();
Queue<Node> nodes = new Queue<>();
//默认,往队列中放入根结点
nodes.enqueue(root);
while(!nodes.isEmpty()){
//从队列中弹出一个结点,把key放入到keys中
Node n = nodes.dequeue();
keys.enqueue(n.key);
//判断当前结点还有没有左子结点,如果有,则放入到nodes中
if (n.left!=null){
nodes.enqueue(n.left);
}
//判断当前结点还有没有右子结点,如果有,则放入到nodes中
if (n.right!=null){
nodes.enqueue(n.right);
}
}
return keys;
}
//获取整个树的最大深度
public int maxDepth(){
return maxDepth(root);
}
//获取指定树x的最大深度
private int maxDepth(Node x){
if (x==null){
return 0;
}
//x的最大深度
int max=0;
//左子树的最大深度
int maxL=0;
//右子树的最大深度
int maxR=0;
//计算x结点左子树的最大深度
if (x.left!=null){
maxL = maxDepth(x.left);
}
//计算x结点右子树的最大深度
if (x.right!=null){
maxR = maxDepth(x.right);
}
//比较左子树最大深度和右子树最大深度,取较大值+1即可
max = maxL>maxR?maxL+1:maxR+1;
return max;
}
}
测试
package cn.itcast.algorithm.test;
import cn.itcast.algorithm.tree.BinaryTree;
public class BinaryTreeTest {
public static void main(String[] args) {
//创建二叉查找树对象
BinaryTree<Integer, String> tree = new BinaryTree<>();
//测试插入
tree.put(1,"张三");
tree.put(2,"李四");
tree.put(3,"王五");
System.out.println("插入完毕后元素的个数:"+tree.size());
//测试获取
System.out.println("键2对应的元素是:"+tree.get(2));
//测试删除
tree.delete(3);
System.out.println("删除后的元素个数:"+tree.size());
System.out.println("删除后键3对应的元素:"+tree.get(3));
}
}
推荐阅读
很多情况下,我们可能需要像遍历数组数组一样,遍历树,从而拿出树中存储的每一个元素,由于树状结构和线性结构不一样,它没有办法从头开始依次向后遍历,所以存在如何遍历,也就是按照什么样的搜索路径进行遍历的问题。
我们把树简单的画作上图中的样子,由一个根节点、一个左子树、一个右子树组成,那么按照根节点什么时候被访问,我们可以把二叉树的遍历分为以下三种方式:
前序遍历: 先访问根结点,然后再访问左子树,最后访问右子树
中序遍历:先访问左子树,中间访问根节点,最后访问右子树
后序遍历:先访问左子树,再访问右子树,最后访问根节点
如果我们分别对下面的树使用三种遍历方式进行遍历,得到的结果如下:
实现步骤
把当前结点的key放入到队列中;
找到当前结点的左子树,如果不为空,递归遍历左子树
找到当前结点的右子树,如果不为空,递归遍历右子树
完整代码
//获取整个树中所有的键
public Queue<Key> preErgodic(){
Queue<Key> keys = new Queue<>();
preErgodic(root, keys);
return keys;
}
//获取指定树x的所有键,并放到keys队列中
private void preErgodic(Node x,Queue<Key> keys){
if (x==null){
return;
}
//把x结点的key放入到keys中
keys.enqueue(x.key);
//递归遍历x结点的左子树
if (x.left!=null){
preErgodic(x.left,keys);
}
//递归遍历x结点的右子树
if (x.right!=null){
preErgodic(x.right,keys);
}
}
测试
//测试前序遍历
public static void main(String[] args) {
//创建树对象
BinaryTree<String, String> tree = new BinaryTree<>();
//往树中添加数据
tree.put("E", "5");
tree.put("B", "2");
tree.put("G", "7");
tree.put("A", "1");
tree.put("D", "4");
tree.put("F", "6");
tree.put("H", "8");
tree.put("C", "3");
//遍历
Queue<String> keys = tree.preErgodic();
for (String key : keys) {
String value = tree.get(key);
System.out.println(key+"----"+value);
}
}
实现步骤
找到当前结点的左子树,如果不为空,递归遍历左子树
把当前结点的key放入到队列中;
找到当前结点的右子树,如果不为空,递归遍历右子树
完整代码
//使用中序遍历获取树中所有的键
public Queue<Key> midErgodic(){
Queue<Key> keys = new Queue<>();
midErgodic(root,keys);
return keys;
}
//使用中序遍历,获取指定树x中所有的键,并存放到key中
private void midErgodic(Node x,Queue<Key> keys){
if (x==null){
return;
}
//先递归,把左子树中的键放到keys中
if (x.left!=null){
midErgodic(x.left,keys);
}
//把当前结点x的键放到keys中
keys.enqueue(x.key);
//在递归,把右子树中的键放到keys中
if(x.right!=null){
midErgodic(x.right,keys);
}
}
测试
//测试中序遍历
public static void main(String[] args) {
//创建树对象
BinaryTree<String, String> tree = new BinaryTree<>();
//往树中添加数据
tree.put("E", "5");
tree.put("B", "2");
tree.put("G", "7");
tree.put("A", "1");
tree.put("D", "4");
tree.put("F", "6");
tree.put("H", "8");
tree.put("C", "3");
//遍历
Queue<String> keys = tree.midErgodic();
for (String key : keys) {
String value = tree.get(key);
System.out.println(key+"----"+value);
}
}
实现步骤
找到当前结点的左子树,如果不为空,递归遍历左子树
找到当前结点的右子树,如果不为空,递归遍历右子树
把当前结点的key放入到队列中;
完整代码
//使用后序遍历,把整个树中所有的键返回
public Queue<Key> afterErgodic(){
Queue<Key> keys = new Queue<>();
afterErgodic(root,keys);
return keys;
}
//使用后序遍历,把指定树x中所有的键放入到keys中
private void afterErgodic(Node x,Queue<Key> keys){
if (x==null){
return ;
}
//通过递归把左子树中所有的键放入到keys中
if (x.left!=null){
afterErgodic(x.left,keys);
}
//通过递归把右子树中所有的键放入到keys中
if (x.right!=null){
afterErgodic(x.right,keys);
}
//把x结点的键放入到keys中
keys.enqueue(x.key);
}
测试
//测试后序遍历
public static void main(String[] args) {
//创建树对象
BinaryTree<String, String> tree = new BinaryTree<>();
//往树中添加数据
tree.put("E", "5");
tree.put("B", "2");
tree.put("G", "7");
tree.put("A", "1");
tree.put("D", "4");
tree.put("F", "6");
tree.put("H", "8");
tree.put("C", "3");
//遍历
Queue<String> keys = tree.afterErgodic();
for (String key : keys) {
String value = tree.get(key);
System.out.println(key+"----"+value);
}
}
所谓的层序遍历,就是从根节点(第一层)开始,依次向下,获取每一层所有结点的值,有二叉树如下:
层序遍历的结果是:EBGADFHC。也就是每层从上倒下、从左到右。
实现步骤
创建队列,存储每一层的结点;
使用循环从队列中弹出一个结点:
完整代码
//使用层序遍历,获取整个树中所有的键
public Queue<Key> layerErgodic(){
//定义两个队列,分别存储树中的键和树中的结点
Queue<Key> keys = new Queue<>();
Queue<Node> nodes = new Queue<>();
//默认,往队列中放入根结点
nodes.enqueue(root);
while(!nodes.isEmpty()){
//从队列中弹出一个结点,把key放入到keys中
Node n = nodes.dequeue();
keys.enqueue(n.key);
//判断当前结点还有没有左子结点,如果有,则放入到nodes中
if (n.left != null){
nodes.enqueue(n.left);
}
//判断当前结点还有没有右子结点,如果有,则放入到nodes中
if (n.right != null){
nodes.enqueue(n.right);
}
}
return keys;
}
测试
//测试层序遍历
public static void main(String[] args) {
//创建树对象
BinaryTree<String, String> tree = new BinaryTree<>();
//往树中添加数据
tree.put("E", "5");
tree.put("B", "2");
tree.put("G", "7");
tree.put("A", "1");
tree.put("D", "4");
tree.put("F", "6");
tree.put("H", "8");
tree.put("C", "3");
//遍历
Queue<String> keys = tree.layerErgodic();
for (String key : keys) {
String value = tree.get(key);
System.out.println(key+"----"+value);
}
}
二叉树的基础遍历运用到了深度优先算法,层序遍历运用到了广度优先算法。推荐观看视频
需求:给定一棵树,请计算树的最大深度(树的根节点到最远叶子结点的最长路径上的结点数);
实现步骤
如果根结点为空,则最大深度为0;
计算左子树的最大深度;
计算右子树的最大深度;
当前树的最大深度=左子树的最大深度和右子树的最大深度中的较大者+1
代码
//获取整个树的最大深度
public int maxDepth(){
return maxDepth(root);
}
//获取指定树x的最大深度
private int maxDepth(Node x){
if (x==null){
return 0;
}
//x的最大深度
int max=0;
//左子树的最大深度
int maxL=0;
//右子树的最大深度
int maxR=0;
//计算x结点左子树的最大深度
if (x.left!=null){
maxL = maxDepth(x.left);
}
//计算x结点右子树的最大深度
if (x.right!=null){
maxR = maxDepth(x.right);
}
//比较左子树最大深度和右子树最大深度,取较大值+1即可
max = maxL>maxR?maxL+1:maxR+1;
return max;
}
需求
请把一段纸条竖着放在桌子上,然后从纸条的下边向上方对折1次,压出折痕后展开。此时 折痕是凹下去的,即折痕突起的方向指向纸条的背面。如果从纸条的下边向上方连续对折2 次,压出折痕后展开,此时有三条折痕,从上到下依次是下折痕、下折痕和上折痕。给定一 个输入参数N,代表纸条都从下边向上方连续对折N次,请从上到下打印所有折痕的方向 例如:N=1时,打印: down;N=2时,打印: down down up
分析
我们把对折后的纸张翻过来,让粉色朝下,这时把第一次对折产生的折痕看做是根结点,那第二次对折产生的下折痕就是该结点的左子结点,而第二次对折产生的上折痕就是该结点的右子结点,这样我们就可以使用树型数据结构来描述对折后产生的折痕。
这棵树有这样的特点:
根结点为下折痕;
每一个结点的左子结点为下折痕;
每一个结点的右子结点为上折痕;
实现步骤
定义结点类
构建深度为N的折痕树;
使用中序遍历,打印出树中所有结点的内容;
构建深度为N的折痕树:
第一次对折,只有一条折痕,创建根结点;
如果不是第一次对折,则使用队列保存根结点;
循环遍历队列:
代码
public class PagerFoldingTest {
public static void main(String[] args) {
//模拟折纸过程,产生树
Node<String> tree = createTree(2);
//遍历树,打印每个结点
printTree(tree);
}
//通过模拟对折N次纸,产生树
public static Node<String> createTree(int N){
//定义根结点
Node<String> root=null;
for (int i = 0; i < N; i++) {
//1.当前是第一次对折
if (i==0){
root = new Node<>("down",null,null);
continue;
}
//2.当前不是第一次对折
//定义一个辅助队列,通过层序遍历的思想,找到叶子结点,叶子结点添加子节点
Queue<Node> queue = new Queue<>();
queue.enqueue(root);
//循环遍历队列
while(!queue.isEmpty()){
//从队列中弹出一个结点
Node<String> tmp = queue.dequeue();
//如果有左子结点,则把左子结点放入到队列中
if (tmp.left!=null){
queue.enqueue(tmp.left);
}
//如果有右子结点,则把右子结点放入到队列中
if (tmp.right!=null){
queue.enqueue(tmp.right);
}
//如果同时没有左子结点和右子结点,那么证明该节点是叶子结点,只需要给该节点添加左子结点和右子结点即可
if (tmp.left==null && tmp.right==null){
tmp.left = new Node<String>("down", null,null);
tmp.right = new Node<String>("up",null,null);
}
}
}
return root;
}
//打印树中每个结点到控制台
public static void printTree(Node<String> root){
//需要使用中序遍历完成
if (root==null){
return;
}
//打印左子树的每个结点
if (root.left!=null){
printTree(root.left);
}
//打印当前结点
System.out.print(root.item+" ");
//打印右子树的每个结点
if (root.right!=null){
printTree(root.right);
}
}
//结点类
private static class Node<T>{
public T item;//存储元素
public Node left;
public Node right;
public Node(T item, Node left, Node right) {
this.item = item;
this.left = left;
this.right = right;
}
}
}
堆是计算机科学中一类特殊的数据结构的统称,堆通常可以被看做是一棵完全二叉树的数组对象。
堆的特性
如果一个结点的位置为k,则它的父结点的位置为**[k/2],而它的两个子结点的位置则分别为2k和2k+1**。这样,在不使用指针的情况下,我们也可以通过计算数组的索引在树中上下移动:从a[k]向上一层,就令k等于k/2,向下一层就令k等于2k或2k+1。
堆的API设计
堆是用数组完成数据元素的存储的,由于数组的底层是一串连续的内存地址,所以我们要往堆中插入数据,我们只能往数组中从索引0处开始,依次往后存放数据,但是堆中对元素的顺序是有要求的,每一个结点的数据要大于等于它的两个子结点的数据,所以每次插入一个元素,都会使得堆中的数据顺序变乱,这个时候我们就需要通过一些方法让刚才插入的这个数据放入到合适的位置。
所以,如果往堆中新插入元素,我们只需要不断的比较新结点a[k]和它的父结点a[k/2]的大小,然后根据结果完成数据元素的交换,就可以完成堆的有序调整。发现新节点a[11],第一次要和a[11/2=5]也就是H,做比较,第二次在和a[5/2=2],也就是P,做比较。
由堆的特性我们可以知道,索引1处的元素,也就是根结点就是最大的元素,当我们把根结点的元素删除后,需要有一个新的根结点出现,这时我们可以暂时把堆中最后一个元素放到索引1处,充当根结点,但是它有可能不满足堆的有序性需求,这个时候我们就需要通过一些方法,让这个新的根结点放入到合适的位置。
完整代码
public class Heap<T extends Comparable<T>> {
//存储堆中的元素
private T[] items;
//记录堆中元素的个数
private int N;
public Heap(int capacity) {
this.items= (T[]) new Comparable[capacity+1];
this.N=0;
}
//判断堆中索引i处的元素是否小于索引j处的元素
private boolean less(int i,int j){
return items[i].compareTo(items[j])<0;
}
//交换堆中i索引和j索引处的值
private void exch(int i,int j){
T temp = items[i];
items[i] = items[j];
items[j] = temp;
}
//往堆中插入一个元素
public void insert(T t){
items[++N]=t;
swim(N);
}
//使用上浮算法,使索引k处的元素能在堆中处于一个正确的位置
private void swim(int k){
//通过循环,不断的比较当前结点的值和其父结点的值,如果发现父结点的值比当前结点的值小,则交换位置
while(k>1){
//比较当前结点和其父结点
if (less(k/2,k)){
exch(k/2,k);
}
k = k/2;
}
}
//删除堆中最大的元素,并返回这个最大元素
public T delMax(){
T max = items[1];
//交换索引1处的元素和最大索引处的元素,让完全二叉树中最右侧的元素变为临时根结点
exch(1,N);
//最大索引处的元素删除掉
items[N]=null;
//元素个数-1
N--;
//通过下沉调整堆,让堆重新有序
sink(1);
return max;
}
//使用下沉算法,使索引k处的元素能在堆中处于一个正确的位置
private void sink(int k){
//通过循环不断的对比当前k结点和其左子结点2*k以及右子结点2k+1处中的较大值的元素大小,如果当前结点小,则需要交换位置
while(2*k<=N){
//获取当前结点的子结点中的较大结点
int max;//记录较大结点所在的索引
if (2*k+1<=N){
if (less(2*k,2*k+1)){
max=2*k+1;
}else{
max=2*k;
}
}else {
max = 2*k;
}
//比较当前结点和较大结点的值
if (!less(k,max)){
break;
}
//交换k索引处的值和max索引处的值
exch(k,max);
//变换k的值
k = max;
}
}
public static void main(String[] args) {
Heap<String> heap = new Heap<String>(20);
heap.insert("A");
heap.insert("B");
heap.insert("C");
heap.insert("D");
heap.insert("E");
heap.insert("F");
heap.insert("G");
String del;
while((del=heap.delMax())!=null){
System.out.print(del+",");
}
}
}
给定一个数组:
String[] arr = {“S”,“O”,“R”,“T”,“E”,“X”,“A”,“M”,“P”,“L”,“E”}
请对数组中的字符按从小到大排序。
实现步骤:
构造堆;
得到堆顶元素,这个值就是最大值;
交换堆顶元素和数组中的最后一个元素,此时所有元素中的最大元素已经放到合适的位置;
对堆进行调整,重新让除了最后一个元素的剩余元素中的最大值放到堆顶;
重复2~4这个步骤,直到堆中剩一个元素为止。
推构造的过程
堆的构造,最直观的想法就是另外再创建一个和新数组数组,然后从左往右遍历原数组,每得到一个元素后,添加到新数组中,并通过上浮,对堆进行调整,最后新的数组就是一个堆。
上述的方式虽然很直观,也很简单,但是我们可以用更聪明一点的办法完成它。创建一个新数组,把原数组0length-1的数据拷贝到新数组的1length处,再从新数组长度的一半处开始往1索引处扫描(从右往左),然后对扫描到的每一个元素做下沉调整即可。
到此位置堆构造完成,堆有序。
堆排序的过程
对构造好的堆,我们只需要做类似于堆的删除操作,就可以完成排序。
将堆顶元素和堆中最后一个元素交换位置;
通过对堆顶元素下沉调整堆,把最大的元素放到堆顶(此时最后一个元素不参与堆的调整,因为最大的数据已经到了数组的最右边)
重复1~2步骤,直到堆中剩最后一个元素。
代码实现
package cn.itcast.algorithm.heap;
public class HeapSort {
//判断heap堆中索引i处的元素是否小于索引j处的元素
private static boolean less(Comparable[] heap, int i, int j) {
return heap[i].compareTo(heap[j])<0;
}
//交换heap堆中i索引和j索引处的值
private static void exch(Comparable[] heap, int i, int j) {
Comparable tmp = heap[i];
heap[i] = heap[j];
heap[j] = tmp;
}
//根据原数组source,构造出堆heap
private static void createHeap(Comparable[] source, Comparable[] heap) {
//把source中的元素拷贝到heap中,heap中的元素就形成一个无序的堆
System.arraycopy(source,0,heap,1,source.length);
//对堆中的元素做下沉调整(从长度的一半处开始,往索引1处扫描)
for (int i = (heap.length)/2;i>0;i--){
sink(heap,i,heap.length-1);
}
}
//对source数组中的数据从小到大排序
public static void sort(Comparable[] source) {
//构建堆
Comparable[] heap = new Comparable[source.length+1];
createHeap(source,heap);
//定义一个变量,记录未排序的元素中最大的索引
int N = heap.length-1;
//通过循环,交换1索引处的元素和排序的元素中最大的索引处的元素
while(N!=1){
//交换元素
exch(heap,1,N);
//排序交换后最大元素所在的索引,让它不要参与堆的下沉调整
N--;
//需要对索引1处的元素进行对的下沉调整
sink(heap,1, N);
}
//把heap中的数据复制到原数组source中
System.arraycopy(heap,1,source,0,source.length);
}
//在heap堆中,对target处的元素做下沉,范围是0~range
private static void sink(Comparable[] heap, int target, int range){
while(2*target<=range){
//1.找出当前结点的较大的子结点
int max;
if (2*target+1<=range){
if (less(heap,2*target,2*target+1)){
max = 2*target+1;
}else{
max = 2*target;
}
}else{
max = 2*target;
}
//2.比较当前结点的值和较大子结点的值
if (!less(heap,target,max)){
break;
}
exch(heap,target,max);
target = max;
}
}
}
普通的队列是一种先进先出的数据结构,元素在队列尾追加,而从队列头删除。在某些情况下,我们可能需要找出队列中的最大值或者最小值,例如使用一个队列保存计算机的任务,一般情况下计算机的任务都是有优先级的,我们需要在这些计算机的任务中找出优先级最高的任务先执行,执行完毕后就需要把这个任务从队列中移除。普通的队列要完成这样的功能,需要每次遍历队列中的所有元素,比较并找出最大值,效率不是很高,这个时候,我们就可以使用一种特殊的队列来完成这种需求,优先队列。
优先队列按照其作用不同,可以分为以下两种:
最大优先队列:可以获取并删除队列中最大的值
最小优先队列:可以获取并删除队列中最小的值
堆这种结构是可以方便的删除最大的值,所以,接下来我们可以基于堆区实现最大优先队列。
package cn.itcast.algorithm.priority;
public class MaxPriorityQueue<T extends Comparable<T>> {
//存储堆中的元素
private T[] items;
//记录堆中元素的个数
private int N;
public MaxPriorityQueue(int capacity) {
this.items = (T[]) new Comparable[capacity+1];
this.N= 0;
}
//获取队列中元素的个数
public int size() {
return N;
}
//判断队列是否为空
public boolean isEmpty() {
return N==0;
}
//判断堆中索引i处的元素是否小于索引j处的元素
private boolean less(int i, int j) {
return items[i].compareTo(items[j])<0;
}
//交换堆中i索引和j索引处的值
private void exch(int i, int j) {
T tmp = items[i];
items[i] = items[j];
items[j] = tmp;
}
//往堆中插入一个元素
public void insert(T t) {
items[++N] = t;
swim(N);
}
//删除堆中最大的元素,并返回这个最大元素
public T delMax() {
T max = items[1];
exch(1,N);
N--;
sink(1);
return max;
}
//使用上浮算法,使索引k处的元素能在堆中处于一个正确的位置
private void swim(int k) {
while(k>1){
if (less(k/2,k)){
exch(k/2,k);
}
k = k/2;
}
}
//使用下沉算法,使索引k处的元素能在堆中处于一个正确的位置
private void sink(int k) {
while(2*k<=N){
int max;
if (2*k+1<=N){
if (less(2*k,2*k+1)){
max=2*k+1;
}else{
max = 2*k;
}
}else {
max = 2*k;
}
if (!less(k,max)){
break;
}
exch(k,max);
k = max;
}
}
}
堆中存放数据元素的数组要满足都满足如下特性:
最大的元素放在数组的索引1处(索引0是不放元素的)。
每个结点的数据总是大于等于它的两个子结点的数据。
其实我们之前实现的堆可以把它叫做大根堆,我们可以用相反的思想实现小根堆,让堆中存放数据元素的数组满足如下特性:
最小的元素放在数组的索引1处。
每个结点的数据总是小于等于它的两个子结点的数据。
package cn.itcast.algorithm.priority;
public class MinPriorityQueue<T extends Comparable<T>> {
//存储堆中的元素
private T[] items;
//记录堆中元素的个数
private int N;
public MinPriorityQueue(int capacity) {
this.items = (T[]) new Comparable[capacity+1];
this.N=0;
}
//获取队列中元素的个数
public int size() {
return N;
}
//判断队列是否为空
public boolean isEmpty() {
return N==0;
}
//判断堆中索引i处的元素是否小于索引j处的元素
private boolean less(int i, int j) {
return items[i].compareTo(items[j])<0;
}
//交换堆中i索引和j索引处的值
private void exch(int i, int j) {
T tmp = items[i];
items[i] = items[j];
items[j] = tmp;
}
//往堆中插入一个元素
public void insert(T t) {
items[++N] = t;
swim(N);
}
//删除堆中最小的元素,并返回这个最小元素
public T delMin() {
T min = items[1];
exch(1,N);
N--;
sink(1);
return min;
}
//使用上浮算法,使索引k处的元素能在堆中处于一个正确的位置
private void swim(int k) {
//通过循环比较当前结点和其父结点的大小
while(k>1){
if (less(k,k/2)){
exch(k,k/2);
}
k = k/2;
}
}
//使用下沉算法,使索引k处的元素能在堆中处于一个正确的位置
private void sink(int k) {
//通过循环比较当前结点和其子结点中的较小值
while(2*k<=N){
//1.找到子结点中的较小值
int min;
if (2*k+1<=N){
if (less(2*k, 2*k+1)){
min = 2*k;
}else{
min = 2*k+1;
}
}else{
min = 2*k;
}
//2.判断当前结点和较小值的大小
if (less(k,min)){
break;
}
exch(k,min);
k = min;
}
}
}
在之前实现的最大优先队列和最小优先队列,他们可以分别快速访问到队列中最大元素和最小元素,但是他们有一个缺点,就是没有办法通过索引访问已存在于优先队列中的对象,并更新它们。为了实现这个目的,在优先队列的基础上,学习一种新的数据结构**,索引优先队列**。接下来我们以最小索引优先队列举列。
通过步骤二的分析,我们可以发现,其实我们通过上浮和下沉做堆调整的时候,其实调整的是pq数组。如果需要对items中的元素进行修改,比如让items[0]=“H”,那么很显然,我们需要对pq中的数据做堆调整,而且是调整pq[9]中元素的位置。但现在就会遇到一个问题,我们修改的是items数组中0索引处的值,如何才能快速的知道需要挑中pq[9]中元素的位置呢?
最直观的想法就是遍历pq数组,拿出每一个元素和0做比较,如果当前元素是0,那么调整该索引处的元素即可,但是效率很低。
我们可以另外增加一个数组,int[] qp,用来存储pq的逆序。例如:
在pq数组中:pq[1]=6;
那么在qp数组中,把6作为索引,1作为值,结果是:qp[6]=1;
当有了pq数组后,如果我们修改items[0]=“H”,那么就可以先通过索引0,在qp数组中找到qp的索引:qp[0]=9,那么直接调整pq[9]即可。
package cn.itcast.algorithm.priority;
public class IndexMinPriorityQueue<T extends Comparable<T>> {
//存储堆中的元素
private T[] items;
//保存每个元素在items数组中的索引,pq数组需要堆有序
private int[] pq;
//保存qp的逆序,pq的值作为索引,pq的索引作为值
private int[] qp;
//记录堆中元素的个数
private int N;
public IndexMinPriorityQueue(int capacity) {
this.items = (T[]) new Comparable[capacity+1];
this.pq = new int[capacity+1];
this.qp= new int[capacity+1];
this.N = 0;
//默认情况下,队列中没有存储任何数据,让qp中的元素都为-1;
for (int i = 0; i < qp.length; i++) {
qp[i]=-1;
}
}
//获取队列中元素的个数
public int size() {
return N;
}
//判断队列是否为空
public boolean isEmpty() {
return N==0;
}
//判断堆中索引i处的元素是否小于索引j处的元素
private boolean less(int i, int j) {
return items[pq[i]].compareTo(items[pq[j]])<0;
}
//交换堆中i索引和j索引处的值
private void exch(int i, int j) {
//交换pq中的数据
int tmp = pq[i];
pq[i] = pq[j];
pq[j] = tmp;
//更新qp中的数据
qp[pq[i]]=i;
qp[pq[j]] =j;
}
//判断k对应的元素是否存在
public boolean contains(int k) {
return qp[k] !=-1;
}
//最小元素关联的索引
public int minIndex() {
return pq[1];
}
//往队列中插入一个元素,并关联索引i
public void insert(int i, T t) {
//判断i是否已经被关联,如果已经被关联,则不让插入
if (contains(i)){
return;
}
//元素个数+1
N++;
//把数据存储到items对应的i位置处
items[i] = t;
//把i存储到pq中
pq[N] = i;
//通过qp来记录pq中的i
qp[i]=N;
//通过堆上浮完成堆的调整
swim(N);
}
//删除队列中最小的元素,并返回该元素关联的索引
public int delMin() {
//获取最小元素关联的索引
int minIndex = pq[1];
//交换pq中索引1处和最大索引处的元素
exch(1,N);
//删除qp中对应的内容
qp[pq[N]] = -1;
//删除pq最大索引处的内容
pq[N]=-1;
//删除items中对应的内容
items[minIndex] = null;
//元素个数-1
N--;
//下沉调整
sink(1);
return minIndex;
}
//删除索引i关联的元素
public void delete(int i) {
//找到i在pq中的索引
int k = qp[i];
//交换pq中索引k处的值和索引N处的值
exch(k,N);
//删除qp中的内容
qp[pq[N]] = -1;
//删除pq中的内容
pq[N]=-1;
//删除items中的内容
items[k]=null;
//元素的数量-1
N--;
//堆的调整
sink(k);
swim(k);
}
//把与索引i关联的元素修改为为t
public void changeItem(int i, T t) {
//修改items数组中i位置的元素为t
items[i] = t;
//找到i在pq中出现的位置
int k = qp[i];
//堆调整
sink(k);
swim(k);
}
//使用上浮算法,使索引k处的元素能在堆中处于一个正确的位置
private void swim(int k) {
while(k>1){
if (less(k,k/2)){
exch(k,k/2);
}
k = k/2;
}
}
//使用下沉算法,使索引k处的元素能在堆中处于一个正确的位置
private void sink(int k) {
while(2*k<=N){
//找到子结点中的较小值
int min;
if (2*k+1<=N){
if (less(2*k,2*k+1)){
min = 2*k;
}else{
min = 2*k+1;
}
}else{
min = 2*k;
}
//比较当前结点和较小值
if (less(k,min)){
break;
}
exch(k,min);
k = min;
}
}
}
测试代码
package cn.itcast.algorithm.test;
import cn.itcast.algorithm.priority.IndexMinPriorityQueue;
public class IndexMinPriorityQueueTest {
public static void main(String[] args) {
//创建索引最小优先队列对象
IndexMinPriorityQueue<String> queue = new IndexMinPriorityQueue<>(10);
//往队列中添加元素
queue.insert(0,"A");
queue.insert(1,"C");
queue.insert(2,"F");
//测试修改
queue.changeItem(2,"B");
//测试删除
while(!queue.isEmpty()){
int index = queue.delMin();
System.out.print(index+" ");
}
}
}
平衡二叉树就是为了解决二叉查找树(删除节点的操作)退化成一颗链表(如上图所示)而诞生了,平衡树具有如下特点
具有二叉查找树的全部特性。
每个节点的左子树和右子树的高度差至多等于1。
例如:图一就是一颗平衡树了,而图二则不是(节点右边标的是这个节点的高度)
对于图二,因为节点9的左孩子高度为2,而右孩子高度为0。他们之间的差值超过1了。
平衡树基于这种特点就可以保证不会出现大量节点偏向于一边的情况了。关于平衡树如何构建、插入、删除、左旋、右旋等操作这里不在说明,具体可以看我之前写的一篇文章:【漫画】以后在有面试官问你AVL树,你就把这篇文章扔给他。
于是,通过平衡树,我们解决了二叉查找树的缺点。对于有 n 个节点的平衡树,最坏的查找时间复杂度也为 O(logn)。
这个就很像Leetcode 的判断一个树是否是平衡二叉树。主要还是利用它的性质来解题。
推荐阅读 什么是平衡二叉树(AVL) - 知乎 (zhihu.com)
推荐观看视频
红黑树(Red-Black Tree,简称R-B Tree),是一种特殊的二叉查找树,同时它只要求部分地达到平衡,任何不平衡都会在三次旋转之内解决,故其增删效率相对 AVL 树更高,查询效率则稍逊。
红黑树的每个节点上都有存储位表示节点的颜色,颜色是红(Red)或黑(Black),其特性如下:
在对红黑树进行一些增删改的操作后,很有可能会出现红色的右链接或者两条连续红色的链接,而这些都不满足红黑树的定义,所以我们需要对这些情况通过旋转进行修复,让红黑树保持平衡。
当某个结点的左子结点为黑色,右子结点为红色,此时需要左旋。
**前提:**当前结点为h,它的右子结点为x;
左旋过程:
让x的左子结点变为h的右子结点:h.right=x.left;
让h成为x的左子结点:x.left=h;
让h的color属性变为x的color属性值:x.color=h.color;
让h的color属性变为RED:h.color=true;
当某个结点的左子结点是红色,且左子结点的左子结点也是红色,需要右旋
**前提:**当前结点为h,它的左子结点为x;
右旋过程:
让x的右子结点成为h的左子结点:h.left = x.right;
让h成为x的右子结点:x.right=h;
让x的color变为h的color属性值:x.color = h.color;
让h的color为RED;
一棵只含有一个键的红黑树只含有一个2-结点。插入另一个键后,我们马上就需要将他们旋转。
用和二叉查找树相同的方式向一棵红黑树中插入一个新键,会在树的底部新增一个结点(可以保证有序性),唯一区别的地方是我们会用红链接将新结点和它的父结点相连。如果它的父结点是一个2-结点,那么刚才讨论的两种方式仍然适用。
在刚才的右旋的过程的最后,节点x的左右还是红色节点。此时就需要颜色反转。
它的使用场景就是,当一个结点的左子结点和右子结点的color都为RED时,也就是出现了临时的4-结点,此时只需要把左子结点和右子结点的颜色变为BLACK,同时让当前结点的颜色变为RED即可。
这种情况大致分为三种子情况:
在结点Node对象中color属性表示的是父结点指向当前结点的连接的颜色,由于根结点不存在父结点,所以每次插入操作后,我们都需要把根结点的颜色设置为黑色。
假设在树的底部的一个3-结点下加入一个新的结点。前面我们所讲的3种情况都会出现。指向新结点的链接可能是3-结点的右链接(此时我们只需要转换颜色即可),或是左链接(此时我们需要进行右旋转然后再转换),或是中链接(此时需要先左旋转然后再右旋转,最后转换颜色)。颜色转换会使中间结点的颜色变红,相当于将它送入了父结点。这意味着父结点中继续插入一个新键,我们只需要使用相同的方法解决即可,直到遇到一个2-结点或者根结点为止。
package cn.itcast.algorithm.tree;
public class RedBlackTree<Key extends Comparable<Key>, Value> {
//根节点
private Node root;
//记录树中元素的个数
private int N;
//红色链接
private static final boolean RED = true;
//黑色链接
private static final boolean BLACK = false;
//结点类
private class Node {
//存储键
public Key key;
//存储值
private Value value;
//记录左子结点
public Node left;
//记录右子结点
public Node right;
//由其父结点指向它的链接的颜色
public boolean color;
public Node(Key key, Value value, Node left, Node right, boolean color) {
this.key = key;
this.value = value;
this.left = left;
this.right = right;
this.color = color;
}
}
//获取树中元素的个数
public int size() {
return N;
}
/**
* 判断当前节点的父指向链接是否为红色
*
* @param x
* @return
*/
private boolean isRed(Node x) {
if (x==null){
return false;
}
return x.color==RED;
}
/**
* 左旋转
*
* @param h
* @return
*/
private Node rotateLeft(Node h) {
//找到h结点的右子结点x
Node x = h.right;
//找到x结点的左子结点,让x结点的左子结点称为h结点的右子结点
h.right = x.left;
//让h结点称为x结点的左子结点
x.left = h;
//让x结点的color属性变为h结点的color属性
x.color = h.color;
//让h结点的color属性变为RED
h.color = RED;
return x;
}
/**
* 右旋
*
* @param h
* @return
*/
private Node rotateRight(Node h) {
//找到h结点的左子结点 x
Node x = h.left;
//让x结点的右子结点成为h结点的左子结点
h.left = x.right;
//让h结点成为x结点的右子结点
x.right = h;
//让x结点的color属性变为h结点的color属性
x.color = h.color;
//让h结点的color属性为RED
h.color = RED;
return x;
}
/**
* 颜色反转,相当于完成拆分4-节点
*
* @param h
*/
private void flipColors(Node h) {
//当前结点变为红色
h.color = RED;
//左子结点和右子结点变为黑色
h.left.color=BLACK;
h.right.color = BLACK;
}
/**
* 在整个树上完成插入操作
*
* @param key
* @param val
*/
public void put(Key key, Value val) {
root = put(root,key,val);
//根结点的颜色总是黑色
root.color = BLACK;
}
/**
* 在指定树中,完成插入操作,并返回添加元素后新的树
*
* @param h
* @param key
* @param val
*/
private Node put(Node h, Key key, Value val) {
//判断h是否为空,如果为空则直接返回一个红色的结点就可以了
if (h == null){
//数量+1
N++;
return new Node(key,val,null,null,RED);
}
//比较h结点的键和key的大小
int cmp = key.compareTo(h.key);
if (cmp<0){
//继续往左
h.left = put(h.left,key,val);
}else if (cmp>0){
//继续往右
h.right = put(h.right,key,val);
}else{
//发生值的替换
h.value = val;
}
//进行左旋:当当前结点h的左子结点为黑色,右子结点为红色,需要左旋
if (isRed(h.right) && !isRed(h.left)){
h = rotateLeft(h);
}
//进行右旋:当当前结点h的左子结点和左子结点的左子结点都为红色,需要右旋
if (isRed(h.left) && isRed(h.left.left)){
rotateRight(h);
}
//颜色反转:当前结点的左子结点和右子结点都为红色时,需要颜色反转
if (isRed(h.left) && isRed(h.right)){
flipColors(h);
}
return h;
}
//根据key,从树中找出对应的值
public Value get(Key key) {
return get(root,key);
}
//从指定的树x中,查找key对应的值
public Value get(Node x, Key key) {
if (x == null){
return null;
}
//比较x结点的键和key的大小
int cmp = key.compareTo(x.key);
if (cmp<0){
return get(x.left,key);
}else if (cmp>0){
return get(x.right,key);
}else{
return x.value;
}
}
}
(8条消息) java面试题 — 红黑树_等待中的小码农-CSDN博客_java 红黑树面试题
面试题——轻松搞定面试中的红黑树问题 - Jessica程序猿 - 博客园 (cnblogs.com)
学习了二叉查找树、2-3树以及它的实现红黑树。2-3树中,一个结点做多能有两个key,它的实现红黑树中使用对链接染色的方式去表达这两个key。接下来我们学习另外一种树型结构B树,这种数据结构中,一个结点允许多于两个key的存在。
B-树是一种树状数据结构,它能够存储数据、对其进行排序并允许以O(logn)的时间复杂度进行查找、顺序读取、插入和删除等操作。
B树中允许一个结点中包含多个key,可以是3个、4个、5个甚至更多,并不确定,需要看具体的实现。现在我们选择一个参数M,来构造一个B树,我们可以把它称作是M阶的B树,那么该树会具有如下特点:
每个结点最多有M-1个key,并且以升序排列;
每个结点最多能有M个子结点;
根结点至少有两个子结点;
在实际应用中B树的阶数一般都比较大(通常大于100),所以,即使存储大量的数据,B树的高度仍然比较小,这样在某些应用场景下,就可以体现出它的优势。
若参数M选择为5,那么每个结点最多包含4个键值对,我们以5阶B树为例,看看B树的数据存储。
B树在磁盘文件中的应用
在我们的程序中,不可避免的需要通过IO操作文件,而我们的文件是存储在磁盘上的。计算机操作磁盘上的文件是通过文件系统进行操作的,在文件系统中就使用到了B树这种数据结构。
磁盘能够保存大量的数据,从GB一直到TB级,但是 他的读取速度比较慢,因为涉及到机器操作,读取速度为毫秒级 。
磁盘由盘片构成,每个盘片有两面,又称为盘面 。盘片中央有一个可以旋转的主轴,他使得盘片以固定的旋转速率旋转,通常是5400rpm或者是7200rpm,一个磁盘中包含了多个这样的盘片并封装在一个密封的容器内 。盘片的每个表面是由一组称为磁道同心圆组成的 ,每个磁道被划分为了一组扇区 ,每个扇区包含相等数量的数据位,通常是512个子节,扇区之间由一些间隙隔开,这些间隙中不存储数据 。
磁盘用磁头来读写存储在盘片表面的位,而磁头连接到一个移动臂上,移动臂沿着盘片半径前后移动,可以将磁头定位到任何磁道上,这称之为寻道操作。一旦定位到磁道后,盘片转动,磁道上的每个位经过磁头时,读写磁头就可以感知到该位的值,也可以修改值。对磁盘的访问时间分为 寻道时间,旋转时间,以及传送时间。
由于存储介质的特性,磁盘本身存取就比主存慢很多,再加上机械运动耗费,因此为了提高效率,要尽量减少磁盘I/O,减少读写操作。 为了达到这个目的,磁盘往往不是严格按需读取,而是每次都会预读,即使只需要一个字节,磁盘也会从这个位置开始,顺序向后读取一定长度的数据放入内存。这样做的理论依据是计算机科学中著名的局部性原理:当一个数据被用到时,其附近的数据也通常会马上被使用。由于磁盘顺序读取的效率很高(不需要寻道时间,只需很少的旋转时间),因此预读可以提高I/O效率。
页是计算机管理存储器的逻辑块,硬件及操作系统往往将主存和磁盘存储区分割为连续的大小相等的块,每个存储块称为一页(1024个字节或其整数倍),预读的长度一般为页的整倍数。主存和磁盘以页为单位交换数据。当程序要读取的数据不在主存中时,会触发一个缺页异常,此时系统会向磁盘发出读盘信号,磁盘会找到数据的起始位置并向后连续读取一页或几页载入内存中,然后异常返回,程序继续运行。
文件系统的设计者利用了磁盘预读原理,将一个结点的大小设为等于一个页(1024个字节或其整数倍),这样每个结点只需要一次I/O就可以完全载入。那么3层的B树可以容纳1024 * 1024 * 1024差不多10亿个数据,如果换成二叉查找树,则需要30层!假定操作系统一次读取一个节点,并且根节点保留在内存中,那么B树在10亿个数据中查找目标值,只需要小于3次硬盘读取就可以找到目标值,但红黑树需要小于30次,因此B树大大提高了IO的操作效率。
特点:
⾮叶⼦结点冗余了叶⼦结点中的键。
叶⼦结点是从⼩到⼤、从左到右排列的。
叶⼦结点之间提供了指针,提⾼了区间访问的性能
只有叶⼦结点存放数据,⾮叶⼦结点是不存放数据的,只存放键
B+树是对B树的一种变形树,它与B树的差异在于:
非叶结点仅具有索引作用,也就是说,非叶子结点只存储key,不存储value;
树的所有叶结点构成一个有序链表,可以按照key排序的次序遍历全部数据。
若参数M选择为5,那么每个结点最多包含4个键值对,我们以5阶B+树为例,看看B+树的数据存储。
B+ 树的优点在于:
由于B+树在非叶子结点上不包含真正的数据,只当做索引使用,因此在内存相同的情况下,能够存放更多的key。
B+树的叶子结点都是相连的,因此对整棵树的遍历只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。而B树则需要进行每一层的递归遍历。
B-树的优点在于:
由于B树的每一个节点都包含key和value,因此我们根据key查找value时,只需要找到key所在的位置,就能找到value,但B+树只有叶子结点存储数据,索引每一次查找,都必须一次一次,一直找到树的最大深度处,也就是叶子结点的深度,才能找到value。
在数据库的操作中,查询操作可以说是最频繁的一种操作,因此在设计数据库时,必须要考虑到查询的效率问题,在很多数据库中,都是用到了B+树来提高查询的效率;
在操作数据库时,我们为了提高查询效率,可以基于某张表的某个字段建立索引,就可以提高查询效率,那其实这个索引就是B+树这种数据结构实现的。
未建立主键索引查询:
执行 select * from user where id=18
,需要从第一条数据开始,一直查询到第6条,发现id=18,此时才能查询出目标结果,共需要比较6次;
建立主键索引查询:
执行 select * from user where id>=12 and id<=18
,如果有了索引,由于B+树的叶子结点形成了一个有序链表,所以我们只需要找到id为12的叶子结点,按照遍历链表的方式顺序往后查即可,效率非常高。