数据结构--二叉树

二叉树的入门

作者:写Bug的拉哥 https://www.bilibili.com/read/cv8521754 出处:bilibili
数据结构--二叉树_第1张图片
写在前面
    
二叉树结构一直以来都是数据结构课程中的重点和难点。不论是找工作的笔试面试,还是考研的专业课,二叉树所占的比例都是很大的。

而在原始的二叉树的基础上,有不断演化出了很多其他基于二叉树的结构,例如本教程涉及的哈夫曼树、红黑树,还有线索二叉树、B+树等等。但是不管从二叉树衍生出来的结构多么复杂多变,但是底层对于二叉树结构的理论和操作都是相通的。

所以我们在这一章节中,从最基本的原生二叉树开始,不断进行总结和实践,最终达到理解和掌握原生二叉树和一些比较有代表性的二叉树变种的目的。

1.树的基本定义

树是我们计算机中非常重要的一种数据结构,同时使用树这种数据结构,可以描述现实生活中的很多事物,例如家谱、单位的组织架构、等等。

树是由n(n>=1)个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。

数据结构--二叉树_第2张图片

树具有以下特点:
 1.每个结点有零个或多个子结点;
 2.没有父结点的结点为根结点;
 3.每一个非根结点只有一个父结点;
 4.每个结点及其后代结点整体上可以看做是一棵树,称为当前结点的父结点的一个子树;

1.1 常见的树结构

1.磁盘上的文件树

实际上在现实生活中,树状结构是十分普遍的。例如在我们的计算机磁盘上存储的文件夹和文件,就能够构成一个文件树结构。其中盘符下存储有文件和文件夹,文件夹下又有子文件和子文件夹,但是文件之下一定不会有其他子文件和子文件夹。

那么将这些结构画成一张图,我们就能够看出他的结构:

数据结构--二叉树_第3张图片

通过上面这张图我们可以看出来:

1.通过盘符或者文件夹,我们只能够向下访问其中的子文件和子文件夹,但是我们不能够从文件夹1直接跳转到文件夹2中去,正如我们不会在D盘中直接访问到C盘是一样的道理;

2.只有盘符或者文件夹下面才能够下挂子文件和子文件夹,但是文件之下是不能够下挂其他任何结构的;

3.每一个盘符和文件夹之下都有多个分支,这些分支“开枝散叶”,形成了复杂的分支结构,而这种分支结构在向上看的时候,最终都会回归到盘符这个层面,所以上面这张图,正如同一棵倒置的大树,其树根在上。我们将这种由节点和分支构成,并且节点之间只能够上线联系,不能够左右沟通的结构,称之为树结构。

在上图中 :我们称所有的盘符、文件夹和文件为树结构的节点;而连接节点与节点之间的通路,称之为路径。如果一个节点指向另一个节点(例如文件夹1和文件2的关系),那么我们称上面指出的节点为父节点或者双亲节点(文件夹1);下面被指向的节点为父节点的孩子节点(文件2)。其中,孩子节点简称子节点。

2. 二叉树:只有两个分叉的树结构

上面我们已经了解了什么是树结构。那么,如果在一棵树中,所有的节点都最多只有两个分支,那么这种特殊的树结构,我们称之为二叉树结构。二叉树形如下图所示:

数据结构--二叉树_第4张图片

也就是说,在二叉树中,一个节点要么不具有子节点,如果具有子节点的话,最多只能有两个子节点。

下面我们开始讨论二叉树中节点在代码中的定义方式。

3.回忆杀:单链表

如果我们将上述节点的结构稍加变化,让每一个节点都具有两个指针域,会得到一个什么样的结构呢?

数据结构--二叉树_第5张图片

然后我们让其中的每一个指针都指向另一个节点,于是乎我们得到如下图所示的一种结构:

数据结构--二叉树_第6张图片

带有两个指针域的节点构成的结构

不难看出,上面的两张图之间是等价的。所以同样的,只要我们在单链表节点结构的基础上稍加改造,就能够得到二叉树节点的代码。习惯性的,我们将一个父节点左边的子节点称之为左孩子节点,右边的子节点称之为右孩子节点:
class Node {

    Object date;  //数据域
    
    Node leftChild;  //左孩子节点
    Node rightChild;  //右孩子节点

}

1.2 树的相关术语

1. 根节点、中间节点和叶子节点

在学习二叉树结构的时候,为了方便讨论,我们将二叉树结构中的节点类型进行如下分类:

根节点:二叉树最上面的节点,特征是只有子节点,没有父节点。如果我们能够得到一个二叉树结构的根节点,那么相当于得到了整个二叉树结构;

中间节点:如果一个节点既有父节点,又有子节点,那么我们称这种节点为中间节点;

叶子节点:如果一个节点只有父节点,没有任何子节点,那么我们称这种节点为叶子结点。

上述三种节点类型,如图所示:

数据结构--二叉树_第7张图片

2. 树的相关术语

数据结构--二叉树_第8张图片

结点的度:
	一个结点含有的子树的个数称为该结点的度  A结点的度为6
叶结点:
	度为0的结点称为叶结点,也可以叫做终端结点 也叫叶子节点
分支结点:
	度不为0的结点称为分支结点,也可以叫做非终端结点
结点的层次:
	从根结点开始,根结点的层次为1,根的直接后继层次为2,以此类推
结点的层序编号:
    将树中的结点,按照从上层到下层,同层从左到右的次序排成一个线性序列,把他们编成连续的自然数。
树的度:
	树中所有结点的度的最大值
树的高度(深度):
	树中结点的最大层次
森林:
 	m(m>=0)个互不相交的树的集合,将一颗非空树的根结点删去,树就变成一个森林;给森林增加一个统一的根
结点,森林就变成一棵树

数据结构--二叉树_第9张图片

孩子结点:
	一个结点的直接后继结点称为该结点的孩子结点
双亲结点(父结点):
	一个结点的直接前驱称为该结点的双亲结点
兄弟结点:
	同一双亲结点的孩子结点间互称兄弟结点`

3.其他概念和公式的补充

节点的度:一个节点的度可以简单的理解为一个节点孩子节点的数量。

在许多面试题中,都使用n0、n1、n2分别表示度为0、度为1、度为2的节点的数量,即有0个孩子节点、1个孩子节点、2个孩子节点的节点数量。

在任意一棵二叉树中,这些节点的数量,之间存在如下关系:
    
1.n2 = n0 - 1:即度为2的节点总比度为0的节点少1个,也就是说,在任意二叉树中,同时具有左右孩子的节点,总比叶子结点的数量少一个;

2.从上面的公式我们能够推导出来:n总 = n0 + n1 + n2 = 2n0 + n1 - 1 = n1 + 2n2 + 1,且n1 = n总 - n0 - n2 = n总 - 2n0 + 1 = n总 - 2n2 - 1;

所以,只要我们知道一个二叉树中总的节点个数以及度为0或者度为2的节点数量,就能够推导出其他度的节点的数量。

注意:上面的公式常常出现在各种笔试题当中,所以请各位熟练记忆和掌握上述公式以及各种变形公式及其推导过程

2. 二叉树的基本定义

1. 二叉树

二叉树就是度不超过2的树(每个结点最多有两个子结点)

数据结构--二叉树_第10张图片

2. 满二叉树

一个二叉树,如果每一层的结点树都达到最大值,则这个树就是满二叉树。
每一层就是 2^k-1
    
在一个满二叉树中存在如下特性:

1.满二叉树的节点数量一定是一个奇数,因为从第2层开始,每一层的节点数量都是2的整数倍,所以最后加上根节点,那么节点的数量一定是奇数;

2.一个具有k层的满二叉树,其节点总数为2^k-1个。这个结论很好推理,实际上就是一个公比为2的等比数列和;

3.第i层上面的节点数量为2^(i-1)个;

4.一个k层的满二叉树,其叶子结点数量(也就是最后一层的节点数量)为2^(k-1)个;

5.如果按照从上到下、从左到右的方式为满二叉树的每一个节点从1开始进行编号,那么满二叉树第k层中的最大编号取值为2^k-1;

6.满二叉树中,编号为m的节点和其左右孩子节点的编号关系是:

   左孩子编号 = 2m

   右孩子编号 = 2m+1

实际上我们在讲解堆排序的时候就推导过类似的关系,只不过在堆排序中,节点的编号是从0开始的。

数据结构--二叉树_第11张图片

3. 完全二叉树

叶节点只能出现在最下层和次下层,并且最下面一层的结点都集中在该层最左边的若干位置的二叉树
叶子节点从左往右放

数据结构--二叉树_第12张图片

你可能感兴趣的:(数据结构,二叉树,数据结构,算法,webgl,大数据)