Java数据结构与算法4-树学习笔记

Java数据结构与算法4-树

  • 1.树的入门
    • 1.1树的基本定义
    • 1.2树的相关术语
    • 1.3二叉树的基本定义
      • 1.3.1二叉树
      • 1.3.2满二叉树
      • 1.3.3完全二叉树
    • 1.4二叉查找树的创建
      • 1.4.1二叉树的结点类API设计
      • 1.4.2 二叉查找树API设计
      • 1.4.3 二叉查找树实现
      • 1.4.4 二叉查找树其他便捷方法
        • 1.4.4.1 查找二叉树中最小的键
        • 1.4.4.2 查找二叉树中最大的键
    • 1.5二叉树的基础遍历
      • 1.5.1 前序遍历
      • 1.5.2 中序遍历
      • 1.5.3 后序遍历
    • 1.6二叉树的层序遍历
    • 1.7二叉树的最大深度问题
    • 1.8折纸问题
  • 2.树的进阶
    • 2.1平衡树
      • 2.1.1 2-3查找树
        • 2.1.1.1 查找
        • 2.1.1.2 插入
          • 2.1.1.2.1向2-结点中插入新键
          • 2.1.1.2.2 向一棵只含有一个3-结点的树中插入新键
          • 2.1.1.2.3 向一个父结点为2-结点的3-结点中插入新键
          • 2.1.1.2.4 向一个父结点为3-结点的3-结点中插入新键
          • 2.1.1.2.5 分解根结点
        • 2.1.1.3 2-3树的性质
        • 2.1.1.4 2-3树的实现
      • 2.1.2红黑树
        • 2.1.2.1红黑树的定义
        • 2.1.2.2红黑树结点API
        • 2.1.2.3平衡化
          • 2.1.2.3.1 左旋
          • 2.1.2.3.2 右旋
        • 2.1.2.4红黑树的插入
          • 2.1.2.4.1向单个2-结点中插入新键
          • 2.1.2.4.2向底部的2-结点插入新键
          • 2.1.2.4.3颜色反转
          • 2.1.2.4.4 向一棵双键树(即一个3-结点)中插入新键
          • 2.1.2.4.5根结点的颜色总是黑色
          • 2.1.2.4.6向树底部的3-结点插入新键
        • 2.1.2.5红黑树API设计
        • 2.1.2.5红黑树代码实现
    • 2.2B-树
      • 2.2.1B树的特性
      • 2.2.2B树存储的数据
      • 2.2.3树在磁盘文件中的应用
        • 2.2.3.1磁盘
        • 2.2.3.2磁盘IO
    • 2.3B+树
      • 2.3.1B+树存储数据
      • 2.3.2B+树和B树的对比
      • 2.3.3B+树在数据库中的应用
        • 2.3.3.1 未建立主键索引查询
        • 2.3.3.2 建立主键索引查询
        • 2.3.3.3 区间查询

1.树的入门

1.1树的基本定义

树是我们计算机中非常重要的一种数据结构,同时使用树这种数据结构,可以描述现实生活中的很多事物,例如家谱、单位的组织架构、等等。
树是由n(n>=1)个有限结点组成一个具有层次关系集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
Java数据结构与算法4-树学习笔记_第1张图片树具有以下特点:

  1. 每个结点有零个或多个子结点;
  2. 没有父结点的结点根结点
  3. 每一个非根结点只有一个父结点;
  4. 每个结点及其后代结点整体上可以看做是一棵树,称为当前结点的父结点的一个子树

1.2树的相关术语

结点的度:
一个结点含有的子树的个数称为该结点的度;
叶结点:
度为0的结点称为叶结点,也可以叫做终端结点
分支结点:
度不为0的结点称为分支结点,也可以叫做非终端结点
结点的层次:
从根结点开始,根结点的层次为1,根的直接后继层次为2,以此类推
结点的层序编号:将树中的结点,按照从上层到下层同层从左到右的次序排成一个线性序列,把他们编成连续的自然数。
树的度:
树中所有结点的度的最大值
树的高度(深度):
树中结点的最大层次
森林:
m(m>=0)个互不相交的树的集合将一颗非空树的根结点删去,树就变成一个森林;给森林增加一个统一的根结点,森林就变成一棵树
Java数据结构与算法4-树学习笔记_第2张图片孩子结点:
一个结点的直接后继结点称为该结点的孩子结点
双亲结点(父结点):
一个结点的直接前驱称为该结点的双亲结点
兄弟结点:
同一双亲结点的孩子结点间互称兄弟结点

1.3二叉树的基本定义

1.3.1二叉树

二叉树就是度不超过2的树(每个结点最多有两个子结点)
Java数据结构与算法4-树学习笔记_第3张图片

1.3.2满二叉树

一个二叉树,如果每一个层的结点树都达到最大值,则这个二叉树就是满二叉树。
Java数据结构与算法4-树学习笔记_第4张图片

1.3.3完全二叉树

叶节点只能出现在最下层次下层,并且最下面一层的结点都集中在该层最左边的若干位置的二叉树
Java数据结构与算法4-树学习笔记_第5张图片

1.4二叉查找树的创建

1.4.1二叉树的结点类API设计

根据对图的观察,我们发现二叉树其实就是由一个一个的结点及其之间的关系组成的,按照面向对象的思想,我们设计一个结点类来描述结点这个事物Java数据结构与算法4-树学习笔记_第6张图片

private class Node {
        //存储键
        public Key key;
        //存储值
        private Value value;
        //记录左子结点
        public Node left;
        //记录右子结点
        public Node right;

        public Node(Key key, Value value, Node left, Node right) {
            this.key = key;
            this.value = value;
            this.left = left;
            this.right = right;
        }
    }

1.4.2 二叉查找树API设计

Java数据结构与算法4-树学习笔记_第7张图片

1.4.3 二叉查找树实现

插入方法put实现思想:

  1. 如果当前树中没有任何一个结点,则直接把新结点当做根结点使用
    在这里插入图片描述2. 如果当前树不为空,则从根结点开始:
    2.1如果新结点的key小于当前结点的key,则继续找当前结点左子结点
    Java数据结构与算法4-树学习笔记_第8张图片

2.2如果新结点的key大于当前结点的key,则继续找当前结点右子结点
Java数据结构与算法4-树学习笔记_第9张图片

2.3如果新结点的key等于当前结点的key,则树中已经存在这样的结点,替换该结点的value值即可。
Java数据结构与算法4-树学习笔记_第10张图片

//向树中添加元素key-value
    public void put(Key key, Value value) {
        root = put(root, key, value);
    }

    //向指定的树x中添加key-value,并返回添加元素后新的树
    private Node put(Node x, Key key, Value value) {
        //如果x子树为空,
        if (x==null){
            N++;
            return new Node(key,value, null,null);
        }

        //如果x子树不为空
        //比较x结点的键和key的大小:

        int cmp = key.compareTo(x.key);
        if (cmp>0){
            //如果key大于x结点的键,则继续找x结点的右子树
            x.right = put(x.right,key,value);

        }else if(cmp<0){
            //如果key小于x结点的键,则继续找x结点的左子树
            x.left = put(x.left,key,value);
        }else{
            //如果key等于x结点的键,则替换x结点的值为value即可
            x.value = value;
        }
        return x;
    }

查询方法get实现思想:
从根节点开始:

  1. 如果要查询的key小于当前结点的key,则继续找当前结点的左子结点;
  2. 如果要查询的key大于当前结点的key,则继续找当前结点的右子结点;
  3. 如果要查询的key等于当前结点的key,则树中返回当前结点的value。
//查询树中指定key对应的value
    public Value get(Key key) {
        return get(root,key);
    }

    //从指定的树x中,查找key对应的值
    public Value get(Node x, Key key) {
        //x树为null
        if (x==null){
            return null;
        }

        //x树不为null

        //比较key和x结点的键的大小
        int cmp = key.compareTo(x.key);
        if (cmp>0){
            //如果key大于x结点的键,则继续找x结点的右子树
            return get(x.right,key);

        }else if(cmp<0){
            //如果key小于x结点的键,则继续找x结点的左子树
            return get(x.left,key);
        }else{
            //如果key等于x结点的键,就找到了键为key的结点,只需要返回x结点的值即可
            return x.value;
        }

    }

删除方法delete实现思想:

  1. 找到被删除结点;
    Java数据结构与算法4-树学习笔记_第11张图片

  2. 找到被删除结点右子树中的最小结点minNode

  3. 删除右子树中的最小结点

  4. 让被删除结点左子树称为最小结点minNode的左子树,让被删除结点的右子树称为最小结点minNode的右子树Java数据结构与算法4-树学习笔记_第12张图片

  5. 让被删除结点的父节点指向最小结点minNode
    Java数据结构与算法4-树学习笔记_第13张图片Java数据结构与算法4-树学习笔记_第14张图片

//删除树中key对应的value
    public void delete(Key key) {
        delete(root, key);
    }

    //删除指定树x中的key对应的value,并返回删除后的新树
    public Node delete(Node x, Key key) {
        //x树为null
        if (x==null){
            return null;
        }

        //x树不为null
        int cmp = key.compareTo(x.key);
        if (cmp>0){
            //如果key大于x结点的键,则继续找x结点的右子树
            x.right = delete(x.right,key);

        }else if(cmp<0){
            //如果key小于x结点的键,则继续找x结点的左子树
            x.left = delete(x.left,key);
        }else{
            //如果key等于x结点的键,完成真正的删除结点动作,要删除的结点就是x;

            //让元素个数-1
            N--;
            //得找到右子树中最小的结点
            if (x.right==null){
                return x.left;
            }

            if (x.left==null){
                return x.right;
            }

            Node minNode = x.right;
            while(minNode.left!=null){
                minNode = minNode.left;
            }

            //删除右子树中最小的结点
            Node n = x.right;
            while(n.left!=null){
                if (n.left.left==null){
                    n.left=null;
                }else{
                    //变换n结点即可
                    n = n.left;
                }
            }

            //让x结点的左子树成为minNode的左子树
            minNode.left = x.left;
            //让x结点的右子树成为minNode的右子树
            minNode.right = x.right;
            //让x结点的父结点指向minNode
            x = minNode;



        }

        return x;
    }

1.4.4 二叉查找树其他便捷方法

1.4.4.1 查找二叉树中最小的键

在某些情况下,我们需要查找出树中存储所有元素的键的最小值,比如我们的树中存储的是学生的排名和姓名数据,那么需要查找出排名最低是多少名?这里我们设计如下两个方法来完成:
在这里插入图片描述

 //查找整个树中最小的键
    public Key min(){
        return min(root).key;
    }

    //在指定树x中找出最小键所在的结点
    private Node min(Node x){

        //需要判断x还有没有左子结点,如果有,则继续向左找,如果没有,则x就是最小键所在的结点
        if (x.left!=null){
            return min(x.left);
        }else{
            return x;
        }
    }
1.4.4.2 查找二叉树中最大的键

在某些情况下,我们需要查找出树中存储所有元素的键的最大值,比如比如我们的树中存储的是学生的成绩和学生的姓名,那么需要查找出最高的分数是多少?这里我们同样设计两个方法来完成:
Java数据结构与算法4-树学习笔记_第15张图片

//在整个树中找到最大的键
    public Key max(){
        return max(root).key;
    }

    //在指定的树x中,找到最大的键所在的结点
    public Node max(Node x){
        //判断x还有没有右子结点,如果有,则继续向右查找,如果没有,则x就是最大键所在的结点
        if (x.right!=null){
            return max(x.right);
        }else{
            return x;
        }
    }

1.5二叉树的基础遍历

很多情况下,我们可能需要像遍历数组数组一样,遍历树,从而拿出树中存储的每一个元素,由于树状结构和线性结构不一样,它没有办法从头开始依次向后遍历,所以存在如何遍历,也就是按照什么样的搜索路径进行遍历的问题。
Java数据结构与算法4-树学习笔记_第16张图片我们把树简单的画作上图中的样子,由一个根节点一个左子树一个右子树组成,那么按照根节点什么时候被访问,我们可以把二叉树的遍历分为以下三种方式
1.前序遍历;
先访问根结点,然后再访问左子树,最后访问右子树
2.中序遍历;(最重要)
先访问左子树,中间访问根节点,最后访问右子树
3.后序遍历;
先访问左子树,再访问右子树,最后访问根节点
如果我们分别对下面的树使用三种遍历方式进行遍历,得到的结果如下:
Java数据结构与算法4-树学习笔记_第17张图片

1.5.1 前序遍历

我们在4.4中创建的树上,添加前序遍历的API:
public Queue preErgodic():使用前序遍历,获取整个树中的所有键 private void preErgodic(Node x,Queue keys) :使用前序遍历,把指定树x中的所有键放入到keys队列中实现过程中,我们通过前序遍历,把,把每个结点的键取出,放入到队列中返回即可。
实现步骤:

  1. 把当前结点的key放入到队列中;
  2. 找到当前结点的左子树,如果不为空,递归遍历左子树
  3. 找到当前结点的右子树,如果不为空,递归遍历右子树

代码:

 //获取整个树中所有的键
    public Queue<Key> preErgodic(){
        Queue<Key> keys = new Queue<>();
        preErgodic(root, keys);
        return keys;
    }

    //获取指定树x的所有键,并放到keys队列中
    private void preErgodic(Node x,Queue<Key> keys){
        if (x==null){
            return;
        }

        //把x结点的key放入到keys中
        keys.enqueue(x.key);

        //递归遍历x结点的左子树
        if (x.left!=null){
            preErgodic(x.left,keys);
        }

        //递归遍历x结点的右子树
        if (x.right!=null){
            preErgodic(x.right,keys);
        }

    }

测试代码


//测试前序遍历
public static void main(String[] args) {
    //创建树对象
    BinaryTree<String, String> tree = new BinaryTree<>();
    //往树中添加数据
    tree.put("E", "5");
    tree.put("B", "2");
    tree.put("G", "7");
    tree.put("A", "1");
    tree.put("D", "4");
    tree.put("F", "6");
    tree.put("H", "8");
    tree.put("C", "3");

    //遍历
    Queue<String> keys = tree.preErgodic();
    for (String key : keys) {
        String value = tree.get(key);
        System.out.println(key+"----"+value);
    }

}

1.5.2 中序遍历

我们在4.4中创建的树上,添加前序遍历的API:
public Queue midErgodic():使用中序遍历,获取整个树中的所有键 private void midErgodic(Node x,Queue keys) 使用中序遍历,把指定树x中的所有键放入到keys队列中
实现步骤

  1. 找到当前结点的左子树,如果不为空,递归遍历左子树
  2. 把当前结点的key放入到队列中;
  3. 找到当前结点的右子树,如果不为空,递归遍历右子树

代码

 //使用中序遍历获取树中所有的键
    public Queue<Key> midErgodic(){
        Queue<Key> keys = new Queue<>();
        midErgodic(root,keys);
        return keys;
    }

    //使用中序遍历,获取指定树x中所有的键,并存放到key中
    private void midErgodic(Node x,Queue<Key> keys){
        if (x==null){
            return;
        }
        //先递归,把左子树中的键放到keys中
        if (x.left!=null){
            midErgodic(x.left,keys);
        }
        //把当前结点x的键放到keys中
        keys.enqueue(x.key);
        //在递归,把右子树中的键放到keys中
        if(x.right!=null){
            midErgodic(x.right,keys);
        }

    }

测试代码

//测试中序遍历
 public static void main(String[] args) {
      //创建树对象
      BinaryTree<String, String> tree = new BinaryTree<>();
      //往树中添加数据
      tree.put("E", "5");
      tree.put("B", "2");
      tree.put("G", "7");
      tree.put("A", "1");
      tree.put("D", "4");
      tree.put("F", "6");
      tree.put("H", "8");
      tree.put("C", "3");

      //遍历
      Queue<String> keys = tree.midErgodic();
      for (String key : keys) {
          String value = tree.get(key);
          System.out.println(key+"----"+value);
      }

  }

1.5.3 后序遍历

我们在4.4中创建的树上,添加前序遍历的API
public Queue afterErgodic():使用后序遍历,获取整个树中的所有键 private void afterErgodic(Node x,Queue keys):使用后序遍历,把指定树x中的所有键放入到keys队列中

实现步骤:

  1. 找到当前结点的左子树,如果不为空,递归遍历左子树
  2. 找到当前结点的右子树,如果不为空,递归遍历右子树
  3. 把当前结点的key放入到队列中

代码:

//使用后序遍历,把整个树中所有的键返回
    public Queue<Key> afterErgodic(){
        Queue<Key> keys = new Queue<>();
        afterErgodic(root,keys);
        return keys;
    }

    //使用后序遍历,把指定树x中所有的键放入到keys中
    private void afterErgodic(Node x,Queue<Key> keys){
        if (x==null){
            return ;
        }

        //通过递归把左子树中所有的键放入到keys中
        if (x.left!=null){
            afterErgodic(x.left,keys);
        }
        //通过递归把右子树中所有的键放入到keys中
        if (x.right!=null){
            afterErgodic(x.right,keys);
        }
        //把x结点的键放入到keys中
        keys.enqueue(x.key);
    }


测试代码

//测试后序遍历
public static void main(String[] args) {
    //创建树对象
    BinaryTree<String, String> tree = new BinaryTree<>();
    //往树中添加数据
    tree.put("E", "5");
    tree.put("B", "2");
    tree.put("G", "7");
    tree.put("A", "1");
    tree.put("D", "4");
    tree.put("F", "6");
    tree.put("H", "8");
    tree.put("C", "3");

    //遍历
    Queue<String> keys = tree.afterErgodic();
    for (String key : keys) {
        String value = tree.get(key);
        System.out.println(key+"----"+value);
    }

}

1.6二叉树的层序遍历

所谓的层序遍历,就是从根节点(第一层)开始,依次向下,获取每一层所有结点的值,有二叉树如下:
Java数据结构与算法4-树学习笔记_第18张图片那么层序遍历的结果是:EBGADFHC
我们在4.4中创建的树上,添加层序遍历的API
public Queue layerErgodic():使用层序遍历,获取整个树中的所有键
实现步骤:

  1. 创建队列,存储每一层的结点;
    Java数据结构与算法4-树学习笔记_第19张图片
  2. 使用循环从队列中弹出一个结点:
    2.1获取当前结点的key;
    2.2如果当前结点的左子结点不为空,则把左子结点放入到队列中
    2.3如果当前结点的右子结点不为空,则把右子结点放入到队列中
    Java数据结构与算法4-树学习笔记_第20张图片

代码

//使用层序遍历,获取整个树中所有的键
 public Queue<Key> layerErgodic(){
     //定义两个队列,分别存储树中的键和树中的结点
     Queue<Key> keys = new Queue<>();
     Queue<Node> nodes = new Queue<>();

     //默认,往队列中放入根结点
     nodes.enqueue(root);

     while(!nodes.isEmpty()){
         //从队列中弹出一个结点,把key放入到keys中
         Node n = nodes.dequeue();
         keys.enqueue(n.key);
         //判断当前结点还有没有左子结点,如果有,则放入到nodes中
         if (n.left!=null){
             nodes.enqueue(n.left);
         }
         //判断当前结点还有没有右子结点,如果有,则放入到nodes中
         if (n.right!=null){
             nodes.enqueue(n.right);
         }
     }
     return keys;
 }

测试代码

 //测试层序遍历
 public static void main(String[] args) {
     //创建树对象
     BinaryTree<String, String> tree = new BinaryTree<>();
     //往树中添加数据
     tree.put("E", "5");
     tree.put("B", "2");
     tree.put("G", "7");
     tree.put("A", "1");
     tree.put("D", "4");
     tree.put("F", "6");
     tree.put("H", "8");
     tree.put("C", "3");

     //遍历
     Queue<String> keys = tree.layerErgodic();
     for (String key : keys) {
         String value = tree.get(key);
         System.out.println(key+"----"+value);
     }

 }

1.7二叉树的最大深度问题

需求:
给定一棵树,请计算树的最大深度(树的根节点到最远叶子结点的最长路径上的结点数);
Java数据结构与算法4-树学习笔记_第21张图片上面这棵树的最大深度为4。
实现:
我们在1.4中创建的树上,添加如下的API求最大深度
public int maxDepth():计算整个树的最大深度
private int maxDepth(Node x):计算指定树x的最大深度
实现步骤:

  1. 如果根结点为空,则最大深度为0;
  2. 计算左子树的最大深度;
  3. 计算右子树的最大深度;
  4. 当前树的最大深度=左子树的最大深度和右子树的最大深度中的较大者+1
    代码:
//获取整个树的最大深度
public int maxDepth(){
     return maxDepth(root);
 }


 //获取指定树x的最大深度
 private int maxDepth(Node x){
     if (x==null){
         return 0;
     }
     //x的最大深度
     int max=0;
     //左子树的最大深度
     int maxL=0;
     //右子树的最大深度
     int maxR=0;

     //计算x结点左子树的最大深度
     if (x.left!=null){
         maxL = maxDepth(x.left);
     }
     //计算x结点右子树的最大深度
     if (x.right!=null){
         maxR = maxDepth(x.right);
     }
     //比较左子树最大深度和右子树最大深度,取较大值+1即可

     max = maxL>maxR?maxL+1:maxR+1;

     return max;
 }

测试代码

public static void main(String[] args) {
        //创建树对象
        BinaryTree<String, String> tree = new BinaryTree<>();
        //往树中添加数据
        tree.put("E", "5");
        tree.put("B", "2");
        tree.put("G", "7");
        tree.put("A", "1");
        tree.put("D", "4");
        tree.put("F", "6");
        tree.put("H", "8");
        tree.put("C", "3");

        int maxDepth = tree.maxDepth();
        System.out.println(maxDepth);
    }

1.8折纸问题

需求:
请把一段纸条竖着放在桌子上,然后从纸条的下边向上方对折1次,压出折痕后展开。此时 折痕是凹下去的,即折痕突起的方向指向纸条的背面。如果从纸条的下边向上方连续对折2 次,压出折痕后展开,此时有三条折痕,从上到下依次是下折痕、下折痕和上折痕。
给定一 个输入参数N,代表纸条都从下边向上方连续对折N次,请从上到下打印所有折痕的方向 例如:N=1时,打印: down;N=2时,打印: down down up
Java数据结构与算法4-树学习笔记_第22张图片分析:
我们把对折后的纸张翻过来,让粉色朝下,这时把第一次对折产生的折痕看做是根结点,那第二次对折产生的下折痕就是该结点的左子结点,而第二次对折产生的上折痕就是该结点的右子结点,这样我们就可以使用树型数据结构来描述对折后产生的折痕。
这棵树有这样的特点:

  1. 根结点为下折痕;
  2. 每一个结点的左子结点为下折痕;
  3. 每一个结点的右子结点为上折痕;
    Java数据结构与算法4-树学习笔记_第23张图片

实现步骤:

  1. 定义结点类
  2. 构建深度为N的折痕树;
  3. 使用中序遍历,打印出树中所有结点的内容;

构建深度为N的折痕树:

  1. 第一次对折,只有一条折痕,创建根结点;
  2. 如果不是第一次对折,则使用队列保存根结点;
  3. 循环遍历队列:
    3.1从队列中拿出一个结点;
    3.2如果这个结点的左子结点不为空,则把这个左子结点添加到队列中;
    3.3如果这个结点的右子结点不为空,则把这个右子结点添加到队列中;
    3.4判断当前结点的左子结点和右子结点都不为空,如果是,则需要为当前结点创建一个值为down的左子结点,一个值为up的右子结点。

代码:

package cn.itcast.algorithm.test;

import cn.itcast.algorithm.linear.Queue;

public class PagerFoldingTest {

    public static void main(String[] args) {

        //模拟这只过程,产生树
        Node<String> tree = createTree(2);
        //遍历树,打印每个结点
        printTree(tree);

    }

    //通过模拟对折N次纸,产生树
    public static Node<String> createTree(int N){
        //定义根结点
        Node<String> root=null;
        for (int i = 0; i < N; i++) {

            //1.当前是第一次对折
            if (i==0){
                root = new Node<>("down",null,null);
                continue;
            }
            //2.当前不是第一次对折
            //定义一个辅助队列,通过层序遍历的思想,找到叶子结点,叶子结点添加子节点
            Queue<Node> queue = new Queue<>();
            queue.enqueue(root);

            //循环遍历队列
            while(!queue.isEmpty()){
                //从队列中弹出一个结点
                Node<String> tmp = queue.dequeue();
                //如果有左子结点,则把左子结点放入到队列中
                if (tmp.left!=null){
                    queue.enqueue(tmp.left);
                }
                //如果有右子结点,则把右子结点放入到队列中
                if (tmp.right!=null){
                    queue.enqueue(tmp.right);
                }
                //如果同时没有左子结点和右子结点,那么证明该节点是叶子结点,只需要给该节点添加左子结点和右子结点即可
                if (tmp.left==null && tmp.right==null){
                    tmp.left = new Node<String>("down", null,null);
                    tmp.right = new Node<String>("up",null,null);
                }
            }
        }
        
        return root;
    }


    //打印树中每个结点到控制台
    public static void printTree(Node<String> root){
        //需要使用中序遍历完成
        if (root==null){
            return;
        }

        //打印左子树的每个结点
        if (root.left!=null){
            printTree(root.left);
        }
        //打印当前结点
        System.out.print(root.item+" ");
        //打印右子树的每个结点
        if (root.right!=null){
            printTree(root.right);
        }

    }



    //结点类
    private static class Node<T>{
        public T item;//存储元素
        public Node left;
        public Node right;

        public Node(T item, Node left, Node right) {
            this.item = item;
            this.left = left;
            this.right = right;
        }
    }


}

2.树的进阶

2.1平衡树

之前我们学习过二叉查找树,发现它的查询效率比单纯的链表和数组的查询效率要高很多,大部分情况下,确实是这样的,但不幸的是,在最坏情况下,二叉查找树的性能还是很糟糕。
例如我们依次往二叉查找树中插入9,8,7,6,5,4,3,2,1这9个数据,那么最终构造出来的树是长得下面这个样子:
Java数据结构与算法4-树学习笔记_第24张图片我们会发现,如果我们要查找1这个元素,查找的效率依旧会很低。效率低的原因在于这个树并不平衡,全部是向左边分支,如果我们有一种方法,能够不受插入数据的影响,让生成的树都像完全二叉树那样,那么即使在最坏情况下,查找的效率依旧会很好。

2.1.1 2-3查找树

为了保证查找树的平衡性,我们需要一些灵活性,因此在这里我们允许树中的一个结点保存多个键。确切的说,我们将一棵标准的二叉查找树中的结点称为2-结点(含有一个键和两条链),而现在我们引入3-结点,它含有两个键和三条链。2-结点和3-结点中的每条链都对应着其中保存的键所分割产生的一个区间。
2-3查找树的定义
一棵2-3查找树要么为空,要么满足满足下面两个要求:
2-结点:
含有一个键(及其对应的值)和两条链左链接指向2-3树中的小于该结点右链接指向的2-3树中的大于该结点
3-结点:
含有两个键(及其对应的值)和三条链左链接指向的2-3树中的小于该结点中链接指向的2-3树中的位于该结点的两个键之间右链接指向的2-3树中的大于该结点
Java数据结构与算法4-树学习笔记_第25张图片

2.1.1.1 查找

将二叉查找树的查找算法一般化我们就能够直接得到2-3树的查找算法。要判断一个键是否在树中,我们先将它和根结点中的键比较。如果它和其中任意一个相等,查找命中;否则我们就根据比较的结果找到指向相应区间的连接,并在其指向的子树中递归地继续查找。如果这个是空链接,查找未命中。
Java数据结构与算法4-树学习笔记_第26张图片Java数据结构与算法4-树学习笔记_第27张图片Java数据结构与算法4-树学习笔记_第28张图片

2.1.1.2 插入
2.1.1.2.1向2-结点中插入新键

往2-3树中插入元素和往二叉查找树中插入元素一样,首先要进行查找,然后将节点挂到未找到的节点上。2-3树之所以能够保证在最差的情况下的效率的原因在于其插入之后仍然能够保持平衡状态。如果查找后未找到的节点是一个2-结点,那么很容易,我们只需要将新的元素放到这个2-结点里面使其变成一个3-结点即可。但是如果查找的节
点结束于一个3-结点,那么可能有点麻烦。
Java数据结构与算法4-树学习笔记_第29张图片Java数据结构与算法4-树学习笔记_第30张图片

2.1.1.2.2 向一棵只含有一个3-结点的树中插入新键

假设2-3树只包含一个3-结点,这个结点有两个键,没有空间来插入第三个键了,最自然的方式是我们假设这个结点能存放三个元素,暂时使其变成一个4-结点,同时他包含四条链接。然后,我们将这个4-结点的中间元素提升,左边的键作为其左子结点,右边的键作为其右子结点。插入完成,变为平衡2-3查找树,树的高度从0变为1。
Java数据结构与算法4-树学习笔记_第31张图片

2.1.1.2.3 向一个父结点为2-结点的3-结点中插入新键

和上面的情况一样一样,我们也可以将新的元素插入到3-结点中,使其成为一个临时的4-结点,然后,将该结点中的中间元素提升到父结点即2-结点中,使其父结点成为一个3-结点,然后将左右结点分别挂在这个3-结点的恰当位置。
Java数据结构与算法4-树学习笔记_第32张图片Java数据结构与算法4-树学习笔记_第33张图片Java数据结构与算法4-树学习笔记_第34张图片

2.1.1.2.4 向一个父结点为3-结点的3-结点中插入新键

当我们插入的结点是3-结点的时候,我们将该结点拆分,中间元素提升至父结点,但是此时父结点是一个3-结点,插入之后,父结点变成了4-结点,然后继续将中间元素提升至其父结点,直至遇到一个父结点是2-结点,然后将其变为3-结点,不需要继续进行拆分。
Java数据结构与算法4-树学习笔记_第35张图片
Java数据结构与算法4-树学习笔记_第36张图片Java数据结构与算法4-树学习笔记_第37张图片Java数据结构与算法4-树学习笔记_第38张图片Java数据结构与算法4-树学习笔记_第39张图片

2.1.1.2.5 分解根结点

当插入结点到根结点的路径上全部是3-结点的时候,最终我们的根结点会编程一个临时的4-结点,此时,就需要将根结点拆分为两个2-结点,树的高度加1。

Java数据结构与算法4-树学习笔记_第40张图片Java数据结构与算法4-树学习笔记_第41张图片

2.1.1.3 2-3树的性质

通过对2-3树插入操作的分析,我们发现在插入的时候,2-3树需要做一些局部的变换来保持2-3树的平衡。
一棵完全平衡的2-3树具有以下性质:

  1. 任意空链接根结点路径长度都是相等的。
  2. 4-结点变换为3-结点时,树的高度不会发生变化,只有当根结点是临时的4-结点,分解根结点时,树高+1。
  3. 2-3树与普通二叉查找树最大的区别在于,普通的二叉查找树是自顶向下生长,而2-3树是自底向上生长。
2.1.1.4 2-3树的实现

直接实现2-3树比较复杂,因为:

  • 需要处理不同的结点类型,非常繁琐;
  • 需要多次比较操作来将结点下移;
  • 需要上移来拆分4-结点;
  • 拆分4-结点的情况有很多种;

2-3查找树实现起来比较复杂,在某些情况插入后的平衡操作可能会使得效率降低。但是2-3查找树作为一种比较重要的概念和思路对于我们后面要讲到的红黑树、B树和B+树非常重要。

2.1.2红黑树

我们前面介绍了2-3树,可以看到2-3树能保证在插入元素之后,树依然保持平衡状态,它的最坏情况下所有子结点都是2-结点,树的高度为lgN,相比于我们普通的二叉查找树,最坏情况下树的高度为N,确实保证了最坏情况下的时间复杂度,但是2-3树实现起来过于复杂,所以我们介绍一种2-3树思想的简单实现:红黑树。
红黑树主要是对2-3树进行编码,红黑树背后的基本思想是用标准的二叉查找树(完全由2-结点构成)和一些额外的信息(替换3-结点)来表示2-3树。我们将树中的链接分为两种类型:
红链接:将两个2-结点连接起来构成一个3-结点;
黑链接:则是2-3树中的普通链接。
确切的说,我们将3-结点表示为由由一条左斜的红色链接(两个2-结点其中之一是另一个的左子结点)相连的两个2-结点。这种表示法的一个优点是,我们无需修改就可以直接使用标准的二叉查找树的get方法
Java数据结构与算法4-树学习笔记_第42张图片

2.1.2.1红黑树的定义

红黑树是含有红黑链接并满足下列条件的二叉查找树:

  1. 链接均为链接;
  2. 没有任何一个结点同时和两条红链接相连;
  3. 该树是完美黑色平衡的,即任意空链接到根结点的路径上的黑链接数量相同;

下面是红黑树与2-3树的对应关系:
Java数据结构与算法4-树学习笔记_第43张图片

2.1.2.2红黑树结点API

因为每个结点都只会有一条指向自己的链接(从它的父结点指向它),我们可以在之前的Node结点中添加一个布尔类型的变量color来表示链接的颜色。如果指向它的链接是红色的,那么该变量的值为true,如果链接是黑色的,那么该变量的值为false。
Java数据结构与算法4-树学习笔记_第44张图片API设计:
Java数据结构与算法4-树学习笔记_第45张图片代码:

 //结点类
    private class Node {
        //存储键
        public Key key;
        //存储值
        private Value value;
        //记录左子结点
        public Node left;
        //记录右子结点
        public Node right;
        //由其父结点指向它的链接的颜色
        public boolean color;

        public Node(Key key, Value value, Node left, Node right, boolean color) {
            this.key = key;
            this.value = value;
            this.left = left;
            this.right = right;
            this.color = color;
        }
    }
2.1.2.3平衡化

在对红黑树进行一些增删改查的操作后,很有可能会出现红色的右链接或者两条连续红色的链接,而这些都不满足红黑树的定义,所以我们需要对这些情况通过旋转进行修复,让红黑树保持平衡。

2.1.2.3.1 左旋

某个结点左子结点为黑色,右子结点为红色,此时需要左旋
前提:当前结点为h,它的右子结点为x;
左旋过程

  1. 让x的左子结点变为h的右子结点:h.right=x.left;
  2. 让h成为x的左子结点:x.left=h;
  3. 让h的color属性变为x的color属性值:x.color=h.color;
  4. 让h的color属性变为RED:h.color=true;
    Java数据结构与算法4-树学习笔记_第46张图片
2.1.2.3.2 右旋

某个结点左子结点是红色且左子结点的左子结点也是红色,需要右旋
前提:当前结点为h,它的左子结点为x;
右旋过程

  1. 让x的右子结点成为h的左子结点:h.left = x.right;
  2. 让h成为x的右子结点:x.right=h;
  3. 让x的color变为h的color属性值:x.color = h.color;
  4. 让h的color为RED;
    此时,下图还是不满足平衡树的定义,后面的颜色反转给出解析
    Java数据结构与算法4-树学习笔记_第47张图片
2.1.2.4红黑树的插入
2.1.2.4.1向单个2-结点中插入新键

一棵只含有一个键的红黑树只含有一个2-结点。插入另一个键后,我们马上就需要将他们旋转。

  • 如果新键小于当前结点的键,我们只需要新增一个红色结点即可,新的红黑树和单个3-结点完全等价。
    Java数据结构与算法4-树学习笔记_第48张图片
  • 如果新键大于当前结点的键,那么新增的红色结点将会产生一条红色的右链接,此时我们需要通过左旋,把红色右链接变成左链接,插入操作才算完成。形成的新的红黑树依然和3-结点等价,其中含有两个键,一条红色链接。
    Java数据结构与算法4-树学习笔记_第49张图片
2.1.2.4.2向底部的2-结点插入新键

用和二叉查找树相同的方式向一棵红黑树中插入一个新键,会在树的底部新增一个结点(可以保证有序性),唯一区别的地方是我们会用红链接将新结点和它的父结点相连。如果它的父结点是一个2-结点,那么刚才讨论的两种方式仍然适用。
Java数据结构与算法4-树学习笔记_第50张图片

2.1.2.4.3颜色反转

当一个结点的左子结点和右子结点的color都为RED时,也就是出现了临时的4-结点,此时只需要把左子结点和右子结点的颜色变为BLACK,同时让当前结点的颜色变为RED即可。
Java数据结构与算法4-树学习笔记_第51张图片

2.1.2.4.4 向一棵双键树(即一个3-结点)中插入新键

这种情况有可以分为三种子情况:

  1. 新键大于原树中的两个键
    Java数据结构与算法4-树学习笔记_第52张图片
  2. 新键小于原树中的两个键
    Java数据结构与算法4-树学习笔记_第53张图片
  3. 新键介于原数中两个键之间
    Java数据结构与算法4-树学习笔记_第54张图片
2.1.2.4.5根结点的颜色总是黑色

之前我们介绍结点API的时候,在结点Node对象中color属性表示的是父结点指向当前结点的连接的颜色,由于根结点不存在父结点,所以每次插入操作后,我们都需要把根结点的颜色设置为黑色。

2.1.2.4.6向树底部的3-结点插入新键

假设在树的底部的一个3-结点下加入一个新的结点。前面我们所讲的3种情况都会出现。指向新结点的链接可能是3-结点的右链接(此时我们只需要转换颜色即可),或是左链接(此时我们需要进行右旋转然后再转换),或是中链接(此时需要先左旋转然后再右旋转,最后转换颜色)。颜色转换会使中间结点的颜色变红,相当于将它送入了父结
点。这意味着父结点中继续插入一个新键,我们只需要使用相同的方法解决即可,直到遇到一个2-结点或者根结点为止
Java数据结构与算法4-树学习笔记_第55张图片Java数据结构与算法4-树学习笔记_第56张图片

2.1.2.5红黑树API设计

Java数据结构与算法4-树学习笔记_第57张图片

2.1.2.5红黑树代码实现
package cn.itcast.algorithm.tree;

public class RedBlackTree<Key extends Comparable<Key>, Value> {
    //根节点
    private Node root;
    //记录树中元素的个数
    private int N;
    //红色链接
    private static final boolean RED = true;
    //黑色链接
    private static final boolean BLACK = false;


    //结点类
    private class Node {
        //存储键
        public Key key;
        //存储值
        private Value value;
        //记录左子结点
        public Node left;
        //记录右子结点
        public Node right;
        //由其父结点指向它的链接的颜色
        public boolean color;

        public Node(Key key, Value value, Node left, Node right, boolean color) {
            this.key = key;
            this.value = value;
            this.left = left;
            this.right = right;
            this.color = color;
        }
    }


    //获取树中元素的个数
    public int size() {
        return N;
    }


    /**
     * 判断当前节点的父指向链接是否为红色
     *
     * @param x
     * @return
     */
    private boolean isRed(Node x) {
        if (x==null){
            return false;
        }
        return x.color==RED;
    }

    /**
     * 左旋转
     *
     * @param h
     * @return
     */
    private Node rotateLeft(Node h) {
        //找到h结点的右子结点x
        Node x = h.right;
        //找到x结点的左子结点,让x结点的左子结点称为h结点的右子结点
        h.right = x.left;
        //让h结点称为x结点的左子结点
        x.left = h;
        //让x结点的color属性变为h结点的color属性
        x.color = h.color;
        //让h结点的color属性变为RED
        h.color = RED;

        return x;
    }

    /**
     * 右旋
     *
     * @param h
     * @return
     */
    private Node rotateRight(Node h) {
        //找到h结点的左子结点 x
        Node x = h.left;
        //让x结点的右子结点成为h结点的左子结点
        h.left = x.right;
        //让h结点成为x结点的右子结点
        x.right = h;
        //让x结点的color属性变为h结点的color属性
        x.color = h.color;
        //让h结点的color属性为RED
        h.color = RED;

        return x;
    }

    /**
     * 颜色反转,相当于完成拆分4-节点
     *
     * @param h
     */
    private void flipColors(Node h) {
        //当前结点变为红色
        h.color = RED;
        //左子结点和右子结点变为黑色
        h.left.color=BLACK;
        h.right.color = BLACK;
    }

    /**
     * 在整个树上完成插入操作
     *
     * @param key
     * @param val
     */
    public void put(Key key, Value val) {
        root = put(root,key,val);
        //根结点的颜色总是黑色
        root.color = BLACK;
    }

    /**
     * 在指定树中,完成插入操作,并返回添加元素后新的树
     *
     * @param h
     * @param key
     * @param val
     */
    private Node put(Node h, Key key, Value val) {
        //判断h是否为空,如果为空则直接返回一个红色的结点就可以了
        if (h == null){
            //数量+1
            N++;
            return new Node(key,val,null,null,RED);
        }

        //比较h结点的键和key的大小
        int cmp = key.compareTo(h.key);
        if (cmp<0){
            //继续往左
            h.left = put(h.left,key,val);

        }else if (cmp>0){
            //继续往右
            h.right = put(h.right,key,val);

        }else{
            //发生值的替换
            h.value = val;
        }

        //进行左旋:当当前结点h的左子结点为黑色,右子结点为红色,需要左旋
        if (isRed(h.right) && !isRed(h.left)){
            h = rotateLeft(h);
        }

        //进行右旋:当当前结点h的左子结点和左子结点的左子结点都为红色,需要右旋
        if (isRed(h.left) && isRed(h.left.left)){
            rotateRight(h);
        }

        //颜色反转:当前结点的左子结点和右子结点都为红色时,需要颜色反转
        if (isRed(h.left) && isRed(h.right)){
            flipColors(h);
        }



        return h;
    }

    //根据key,从树中找出对应的值
    public Value get(Key key) {
        return get(root,key);
    }

    //从指定的树x中,查找key对应的值
    public Value get(Node x, Key key) {
        if (x == null){
            return null;
        }

        //比较x结点的键和key的大小
        int cmp = key.compareTo(x.key);
        if (cmp<0){
            return get(x.left,key);
        }else if (cmp>0){
            return get(x.right,key);
        }else{
           return x.value;
        }

    }

}

2.2B-树

前面我们已经学习了二叉查找树、2-3树以及它的实现红黑树。2-3树中,一个结点做多能有两个key,它的实现红黑树中使用对链接染色的方式去表达这两个key。接下来我们学习另外一种树型结构B树,这种数据结构中,一个结点允许多于两个key的存在。
B树是一种树状数据结构,它能够存储数据、对其进行排序并允许以==O(logn)==的时间复杂度进行查找、顺序读取、插入和删除等操作。

2.2.1B树的特性

B树中允许一个结点中包含多个key,可以是3个、4个、5个甚至更多,并不确定,需要看具体的实现。现在我们选择一个参数M,来构造一个B树,我们可以把它称作是M阶的B树,那么
该树会具有如下特点:

  • 每个结点最多有M-1个key,并且以升序排列;
  • 每个结点最多能有M个子结点;
  • 根结点至少有两个子结点;
    Java数据结构与算法4-树学习笔记_第58张图片

在实际应用中B树的阶数一般都比较大(通常大于100),所以,即使存储大量的数据,B树的高度仍然比较小,这样在某些应用场景下,就可以体现出它的优势。

2.2.2B树存储的数据

若参数M选择为5,那么每个结点最多包含4个键值对,我们以5阶B树为例,看看B树的数据存储。
Java数据结构与算法4-树学习笔记_第59张图片Java数据结构与算法4-树学习笔记_第60张图片Java数据结构与算法4-树学习笔记_第61张图片

2.2.3树在磁盘文件中的应用

在我们的程序中,不可避免的需要通过IO操作文件,而我们的文件是存储在磁盘上的。计算机操作磁盘上的文件是
通过文件系统进行操作的,在文件系统中就使用到了B树这种数据结构。

2.2.3.1磁盘

磁盘能够保存大量的数据,从GB一直到TB级,但是 他的读取速度比较慢,因为涉及到机器操作,读取速度为毫秒级 。
Java数据结构与算法4-树学习笔记_第62张图片磁盘由盘片构成,每个盘片有两面,又称为盘面 。盘片中央有一个可以旋转的主轴,他使得盘片以固定的旋转速率旋转,通常是5400rpm或者是7200rpm,一个磁盘中包含了多个这样的盘片并封装在一个密封的容器内 。盘片的每个表面是由一组称为磁道同心圆组成的 ,每个磁道被划分为了一组扇区 ,每个扇区包含相等数量的数据位,通常
是512个子节,扇区之间由一些间隙隔开,这些间隙中不存储数据 。

2.2.3.2磁盘IO

Java数据结构与算法4-树学习笔记_第63张图片磁盘用磁头来读写存储在盘片表面的位,而磁头连接到一个移动臂上,移动臂沿着盘片半径前后移动,可以将磁头定位到任何磁道上,这称之为寻道操作。一旦定位到磁道后,盘片转动,磁道上的每个位经过磁头时,读写磁头就可以感知到该位的值,也可以修改值。对磁盘的访问时间分为 寻道时间,旋转时间,以及传送时间。

由于存储介质的特性,磁盘本身存取就比主存慢很多,再加上机械运动耗费,因此为了提高效率,要尽量减少磁盘I/O,减少读写操作。 为了达到这个目的,磁盘往往不是严格按需读取,而是每次都会预读,即使只需要一个字节,磁盘也会从这个位置开始,顺序向后读取一定长度的数据放入内存。这样做的理论依据是计算机科学中著名的局部性原理:当一个数据被用到时,其附近的数据也通常会马上被使用。由于磁盘顺序读取的效率很高(不需要寻道时间,只需很少的旋转时间),因此预读可以提高I/O效率。

是计算机管理存储器的逻辑块,硬件及操作系统往往将主存和磁盘存储区分割为连续的大小相等的块,每个存储块称为一页(1024个字节或其整数倍),预读的长度一般为页的整倍数。主存和磁盘以页为单位交换数据。当程序要读取的数据不在主存中时,会触发一个缺页异常,此时系统会向磁盘发出读盘信号,磁盘会找到数据的起始位置并向后连续读取一页或几页载入内存中,然后异常返回,程序继续运行。

文件系统的设计者利用了磁盘预读原理将一个结点的大小设为等于一个页(1024个字节或其整数倍),这样每个结点只需要一次I/O就可以完全载入。那么3层的B树可以容纳102410241024差不多10亿个数据,如果换成二叉查找树,则需要30层!假定操作系统一次读取一个节点,并且根节点保留在内存中,那么B树在10亿个数据中查找目标值,只需要小于3次硬盘读取就可以找到目标值,但红黑树需要小于30次,因此B树大大提高了IO的操作效率

2.3B+树

B+树是对B树的一种变形树,它与B树的差异在于:

  1. 非叶结点仅具有索引作用,也就是说,非叶子结点只存储key,不存储value
  2. 树的所有叶结点构成一个有序链表,可以按照key排序的次序遍历全部数据。

2.3.1B+树存储数据

若参数M选择为5,那么每个结点最多包含4个键值对,我们以5阶B+树为例,看看B+树的数据存储。
Java数据结构与算法4-树学习笔记_第64张图片Java数据结构与算法4-树学习笔记_第65张图片

2.3.2B+树和B树的对比

B+ 树的优点在于:

  1. 由于B+树在非叶子结点上不包含真正的数据,只当做索引使用,因此在内存相同的情况下,能够存放更多的key。
  2. B+树的叶子结点都是相连的,因此对整棵树的遍历只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。而B树则需要进行每一层的递归遍历。
    B树的优点在于:
    由于B树的每一个节点都包含key和value,因此我们根据key查找value时,只需要找到key所在的位置,就能找到value,但B+树只有叶子结点存储数据,索引每一次查找,都必须一次一次,一直找到树的最大深度处,也就是叶子结点的深度,才能找到value。

2.3.3B+树在数据库中的应用

在数据库的操作中查询操作可以说是最频繁的一种操作,因此在设计数据库时,必须要考虑到查询的效率问题,在很多数据库中,都是用到了B+树来提高查询的效率;
在操作数据库时,我们为了提高查询效率,可以基于某张表的某个字段建立索引,就可以提高查询效率,那其实这个索引就是B+树这种数据结构实现的。

2.3.3.1 未建立主键索引查询

Java数据结构与算法4-树学习笔记_第66张图片执行 select * from user where id=18 ,需要从第一条数据开始,一直查询到第6条,发现id=18,此时才能查询出目标结果,共需要比较6次;

2.3.3.2 建立主键索引查询

Java数据结构与算法4-树学习笔记_第67张图片

2.3.3.3 区间查询

执行 select * from user where id>=12 and id<=18 ,如果有了索引,由于B+树的叶子结点形成了一个有序链表,所以我们只需要找到id为12的叶子结点,按照遍历链表的方式顺序往后查即可,效率非常高。

你可能感兴趣的:(Java数据结构与算法,java,数据结构,b树)