二叉树、红黑树、B树等的简单介绍

一些概念

  • 首先树是一种数据结构,不同于图,树具有拓扑性,从根节点到任意节点的路径都是唯一的;
  • 树可以理解为现实世界中树的抽象,一个根,向上分叉;
  • 我们把每个节点只有两个分叉的叫二叉树,超过2个分叉的叫多叉树;
  • 现实世界的树一般都是比较均匀和对称的,在数据结构里,我们定义:如果一棵树的任意节点的子树的高度差不超过1,则称为平衡树;
  • 如果树的节点存储了可排序的数据,并且左树所有节点的数据一定小于(或大于)相邻右树的所有节点数据,则称为查找树;

常见的树

  1. 二叉树、二叉查找树
  • 最常见的数据结构,也是编程时候最常用的,比如JDK里的TreeMap、TreeSet就是二叉查找树;
  1. 红黑树
  • 二叉查找树的影响力最大工业实现,JDK里实际都是使用的红黑树来实现, 红黑树是一颗二叉平衡查找树
  1. B树
  • 为何要设计B树?因为计算机的磁盘IO非常耗时,而二叉查找树的高度比较大,导致磁盘IO次数频繁,效率低下,需要设计多叉树;
  • B树怎么设计的?每个节点一般为一个磁盘block(4k左右),每个节点存储了N个关键字和N+1个指针,叶子节点只存储了N个关键字。这样每个节点可以存储几十到上千的分叉,树高度大大缩小;
  1. B+
  • 为何需要B+树?像Mysql等数据库对数据存储的查询效率提出了更高的要求,而B树有若干缺点:
    1. B树所有节点里存储了数据,导致每个节点的分叉树受限制;
    2. B树不方便做范围查询;
  • 如何设计B+树?当然是针对B树的缺点进行改造。
    1. 所有B+树的节点不存储真实数据,只存储索关键字和子树指针,可以更多的分叉;
    2. B+树的叶子节点包含所有的关键字,并将关键字指向了真实数据的存储地址;
    3. B+树的相邻叶子节点建立了指针联系,方便范围查询;
  1. B*
    B+树的改造版本,节点分叉做更严格限制,对应m阶的B+树(每个节点分叉至少 1/2*m),转换为B*树的规则,每个节点需要分叉至少 2/3*m,同时针对非叶子节点的相邻兄弟节点之间,也增加了指针联系;
  2. R树
    B树的Rectangular版本,空间版本,用于高纬度的多叉平衡查找树,比如谷歌地区的区域查找,附近N公司的餐厅等等场景;
    R树的节点存储的是一个矩形空间信息,父节点是一个包含所有子节点矩形的更大矩形;
    B树是一维度的排序,而R树是一个包含N个维度排序的树,节点之间排序需要考虑(X轴、Y轴、……)。
    R树的查找和插入,同样也需要节点的遍历、节点的裂变等;

参考资料

https://blog.csdn.net/fuzhongmin05/article/details/58064326

你可能感兴趣的:(二叉树、红黑树、B树等的简单介绍)