一些概念
- 首先树是一种数据结构,不同于图,树具有拓扑性,从根节点到任意节点的路径都是唯一的;
- 树可以理解为现实世界中树的抽象,一个根,向上分叉;
- 我们把每个节点只有两个分叉的叫二叉树,超过2个分叉的叫多叉树;
- 现实世界的树一般都是比较均匀和对称的,在数据结构里,我们定义:如果一棵树的任意节点的子树的高度差不超过1,则称为平衡树;
- 如果树的节点存储了可排序的数据,并且左树所有节点的数据一定小于(或大于)相邻右树的所有节点数据,则称为查找树;
常见的树
- 二叉树、二叉查找树
- 最常见的数据结构,也是编程时候最常用的,比如JDK里的TreeMap、TreeSet就是二叉查找树;
- 红黑树
- 二叉查找树的影响力最大工业实现,JDK里实际都是使用的红黑树来实现, 红黑树是一颗
二叉平衡查找树
;
- B树
- 为何要设计B树?因为计算机的磁盘IO非常耗时,而二叉查找树的高度比较大,导致磁盘IO次数频繁,效率低下,需要设计多叉树;
- B树怎么设计的?每个节点一般为一个磁盘block(4k左右),每个节点存储了N个关键字和N+1个指针,叶子节点只存储了N个关键字。这样每个节点可以存储几十到上千的分叉,树高度大大缩小;
B+
树
- 为何需要B+树?像Mysql等数据库对数据存储的查询效率提出了更高的要求,而B树有若干缺点:
- B树所有节点里存储了数据,导致每个节点的分叉树受限制;
- B树不方便做范围查询;
- 如何设计B+树?当然是针对B树的缺点进行改造。
- 所有B+树的节点不存储真实数据,只存储索关键字和子树指针,可以更多的分叉;
- B+树的叶子节点包含所有的关键字,并将关键字指向了真实数据的存储地址;
- B+树的相邻叶子节点建立了指针联系,方便范围查询;
-
B*
树
B+树的改造版本,节点分叉做更严格限制,对应m阶的B+树(每个节点分叉至少1/2*m
),转换为B*树的规则,每个节点需要分叉至少2/3*m
,同时针对非叶子节点的相邻兄弟节点之间,也增加了指针联系; - R树
B树的Rectangular
版本,空间版本,用于高纬度的多叉平衡查找树,比如谷歌地区的区域查找,附近N公司的餐厅等等场景;
R树的节点存储的是一个矩形空间信息,父节点是一个包含所有子节点矩形的更大矩形;
B树是一维度的排序,而R树是一个包含N个维度排序的树,节点之间排序需要考虑(X轴、Y轴、……)。
R树的查找和插入,同样也需要节点的遍历、节点的裂变等;
参考资料
https://blog.csdn.net/fuzhongmin05/article/details/58064326