目录
1、树的概念及结构
树的概念
树的专有名词
树的表示
树在实际中的运用
2、二叉树的概念及结构
二叉树的概念
特殊的二叉树
二叉树的性质
二叉树的储存结构
现实中的树:
数据结构中的树:
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
特点:
1、有一个特殊的结点,称为根结点,根节点没有前驱结点
2、除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一 个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
3、因此,树是递归定义的。
⚠:注意
1、树形结构中,子树之间不能有交集,否则就不是树形结构。
2、除了根节点外,每个节点有且仅有一个父节点,
如图:(下面两个就不是树形结构)
3、一颗N个节点的树有N-1条边。
树的专有名词
1.节点的度:一个节点含有的子树的个数称为该节点的度;如上图:A的为6
2.叶节点或终端节点:度为0的节点称为叶节点;如上图:B、C、H、I...等节点为叶节点
3.非终端节点或分支节点:度不为0的节点;如上图:D、E、F、G...等节点为分支节点
4.双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;如上图:A是B的父节点
5.孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;如上图:B是A的孩子节点
6.兄弟节点:具有相同父节点的节点互称为兄弟节点;如上图:B、C是兄弟节点
7.树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
8.节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
9.树的高度或深度:树中节点的最大层次;如上图:树的高度为4
10.堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
11.节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
12.子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
13.森林:由m(m>0)棵互不相交的树的集合称为森林;
14.最近公共祖先: 如上图:P和Q的共同祖先有J、E、A,而P和Q的最近公共祖先为J,节点本身也可以为自己的祖先,如K和F的最近公共祖先为F。
树结构的表示的困难之处在于不知道每个结点的孩子的数量。假如我们知道树的度,我们可以定义出树的结构。
//假设指定树的度,我们可以直接定义 #define N 5 struct TreeNode { int data; struct TreeNode* subs[N]; //指针数组用于储存孩子结点的地址,每个结点存5个 };
⭐:但是这样定义又有一个缺陷,假设我们知道树的度为5,那么我们这样定义会导致每个结点的度均为5,但事实上每个结点的度都<=5,由此可见用这种定义方式会导致空间浪费。此外当我们不知道树的度的时候,上述定义方法就不起作用了。
储存树最优秀的表示方法—孩子兄弟表示法
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法
//孩子兄弟表示法 typedef int DataType; struct TreeNode { struct TreeNode* firstChild; //第一个孩子结点 struct TreeNode* pNextBrother; //指向其下一个兄弟结点 DataType data; //存储结点中的数据 };
✈画图表示✈:
假设我们要表示如下的树:
物理结构如下:
:通过上图我们可以发现:一个结点有多少个孩子都无所谓;父亲指向第一个孩子,剩下的孩子,用孩子的兄弟指针链接起来。
(表示文件系统的目录树结构)
二叉树:度为2的树,一颗二叉树是结点的一个有限集合。该集合:
1.或者为空
2. 由一个根节点加上两棵别称为左子树和右子树的二叉树组成
如图:
从上图可以看出:
1. 二叉树不存在度大于2的结点
2. 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
⚠:注意
对于任意的二叉树都是由以下几种情况复合而成的:
现实中的二叉树 :
当看到这些图片时:‘
程序员:哎?卧槽!!这不是满二叉树吗???
非程序员:这树好对称、标准啊!这就是大自然的魅力!!
1、满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是2^k-1,则它就是满二叉树。
2、完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。
两者区别:
满二叉树:当树的深度为K时,满二叉树在【1,K】层均满。
完全二叉树:当树的深度为K时,完全二叉树在【1,K-1】层的区间内均为满二叉树,只有最后一层第K层不满,但是最后一层是从左到右连续的。
性质1:若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点.
性质2:若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h-1.
性质3:对任何一棵非空二叉树, 如果度为0其叶结点个数为n0 , 度为2的分支结点个数为n2,则有n0=n2+1.
性质4:若规定根节点的层数为1,具有n个结点的满二叉树的深度h=log2(N+1).
性质5:对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
1. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
2. 若2i+1
=n,则无左孩子。 3. 若2i+2
=n,则无右孩子。
⭐:二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而在现实使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
:假设我们要表示如下的完全二叉树(逻辑结构)
:我们用数组去储存(物理结构)
:我们接下来要做的就是如何将数组的物理结构想象成完全二叉树的逻辑结构。
:用数组的物理结构表现出二叉树的逻辑结构,其关键点就在于如何理清父亲与孩子的关系。
首先我们假设父亲的下标为parent,左孩子的下标为leftchild,右孩子的下标为rightchild,则父子间的下标关系如下:
1、leftchild=parent*2+1;
2、rightchild=parent*2+2;
3、parent=(child-1)/2;
由图中我们可以看出所有左孩子的下标均为奇数,而右孩子的下标均为偶数,所以当我们推导父亲下标的表达式时,无论是左孩子还是右孩子,parent=(child-1)/2都适用。
1. 链式存储
二叉树的链式存储结构是指用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面学到高阶数据结构如红黑树等会用到三叉链。
typedef int BTDataType; // 二叉链 struct BinaryTreeNode { struct BinaryTreeNode* leftChild; //指向当前结点左孩子 struct BinaryTreeNode* rightChild; //指向当前结点右孩子 BTDataType data; //当前结点值域 };
typedef int BTDataType; // 二叉链 struct BinaryTreeNode { struct BinaryTreeNode* parent; //指向当前结点的双亲 struct BinaryTreeNode* leftChild; //指向当前结点左孩子 struct BinaryTreeNode* rightChild; //指向当前结点右孩子 BTDataType data; //当前结点值域 };