1. 树的概念
之前的文章,我们了解了一对一的线性结构的概念及一些操作,而这篇文章我们了解一下一对多的树形结构。
1.1 树的定义
树是n(n≥0)个结点的有限集。
在任何一个非空树中:
①:有且仅有一个特定的称为根的结点。
②:当n>1时,其余结点可分为m(m>0)个互不相交的有限集,其中每个集合本身又是一棵树,并且称为根的子树。
树的示意图如下:
上图中子树T1和子树T2都是结点A的子树,D、H、I组成的树又是B结点的子树,E、F、G、J组成的树又是C结点的子树。
1.2 结点分类
树的结点包含一个数据元素以及若干指向其子树的分支。结点拥有的子树数量称为结点的度。度为0的结点称为叶子结点或终端结点,度不为0的结点称为分支结点或非终端结点。除了根节点外,分支结点也称为内部结点。树的度是树内结点的度的最大值。
下图中,这棵树中C结点的度最大,为3,因此这棵树的度为3。
1.3 结点间关系
双亲和孩子:结点的子树的根称为该结点的孩子,相应的,该结点称为孩子的双亲,如下图中C的双亲为A,C的孩子有E、F和G。
兄弟:同一个双亲的孩子之间称为兄弟,如下图中的E、F和G。
祖先:从根到该结点所经历的分支上的所有结点,如下图中的J的祖先为A、C、E。
子孙:以某点为根的子树中的任一结点都称为该结点的子孙。如下图中的B的子孙有D、H、I。
堂兄弟:双亲在同一层的结点互为堂兄弟,如下图中的D、E。
1.4 其他相关概念
层次:结点的层次从根结点开始定义起,根为第一层,根的孩子为第二层。树中任一层次等于双亲结点的层次加1。
结点的高度:结点到叶子结点的最长路径(边数)。
结点的深度:根结点到这个节点所经历的边的个数。
树的高度:根结点的高度。
如果将树中结点的各子树堪称从左至右是有次序的,不能互换的,则称该树为有序树,否则为无序树。
2. 二叉树概念
2.1 二叉树定义
二叉树是n(n≥0)个结点的有限集合,该集合或者为空集(空二叉树),或者由一个根结点和两个互不相交的、分别称为根结点左子树和右子树的二叉树组成。
如下图中,图一是一个正确的二叉树,图二则不是二叉树,因为C结点有3个孩子。
二叉树的特点
- 每个结点最多有两个子树,所以二叉树中不存在度大于2的结点。
- 左子树和右子树是有顺序的,次序不能颠倒。
- 即使树中只有一颗子树,也要区分是左子树还是右子树。
二叉树的五种形态:
- 空二叉树。
- 只有一个根结点。
- 根结点只有左子树。
- 根结点只有右子树。
- 根结点既有左子树,又有右子树。
如果二叉树不为空,且有3个结点,那么其形态如下图:
2.2 特殊二叉树
2.2.1 斜树
斜树一定是斜的,所有的结点都只有左子树叫做左斜树,所有的结点都只有右子树叫做右斜树,左斜树和右斜树统称为斜树。
上图中树2和树3就是斜树。
2.2.2 满二叉树
在一棵二叉树中,所有的分支结点都有左子树和右子树,并且所有的叶子结点都在同一层上,这样的二叉树称为满二叉树。如下图所示:
满二叉树有特点:
- 叶子结点只能出现在最下一层,出现在其他层就不能达到平衡,也就不是满二叉树了。
- 非叶子结点的度一定是2,如果有不是2的,那么此树就不是二叉树了。
- 在同样深度的二叉树中,满二叉树的结点个数最多,叶子结点最多。
2.2.3 完全二叉树
对于一棵具有n个结点的二叉树按照层序编号,如果编号为i(1≤i≤n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵树称为完全二叉树。如下图所示:
上图中:
- 如果没有结点6、结点7,而结点8、结点9仍存在,即结点3无孩子,那么这棵树就不是完全二叉树。
- 如果没有结点8,而结点9仍存在,即结点4只有右孩子,那么这棵树就不是完全二叉树。
完全二叉树特点:
- 叶子结点只能出现在最下两层。
- 最下一层的叶子结点一定集中在左侧连续位置。
- 倒数第二层,如果有叶子结点,一定都集中在右侧连续位置。
- 如果结点度为1,那么只能有左孩子。
- 同样结点数的二叉树,完全二叉树的深度最小。
2.3 二叉树性质
- 在二叉树的第i层上最多有2i-1个结点(i≥1)。
- 深度为k的二叉树最多有2k-1个结点(k≥1)。
- 对于任何一个二叉树,如果其叶子结点数为n0,度数为2的结点数为n2,那么n0=n2+1,也就是叶子结点数为度为2的结点数加1。
- 具有n个结点的完全二叉树深度为(log2n)+1。
- 对具有n个结点的完全二叉树,如果按照从上至下和从左至右的顺序对二叉树的所有结点从1开始编号,则对于任意的序号为i的结点有:
A. 如果i>1,那么序号为i的结点的双亲结点序号为i/2;
B. 如果i=1,那么序号为i的结点为根节点,无双亲结点;
C. 如果2i<=n,那么序号为i的结点的左孩子结点序号为2i;
D. 如果2i>n,那么序号为i的结点无左孩子;
E. 如果2i+1<=n,那么序号为i的结点右孩子序号为2i+1;
F. 如果2i+1>n,那么序号为i的结点无右孩子。
3. 二叉树顺序存储
3.1 二叉树的顺序存储结构
二叉树的顺序存储结构用一维数组存储二叉树中的结点,并且结点的存储位置,即数组的下标要能体现结点之间的逻辑关系,比如双亲与孩子,兄弟之间的关系等。
1. 完全二叉树的存储:
对于完全二叉树,用顺序结构可以表现出二叉树的结构来。
2. 一般二叉树存储:
对于一般二叉树,我们把不存在的结点设置为"^",下图中橘色为不存在的结点。
上图为深度为3的右斜树,我们看到数组开辟了7个空间,但是实际却只用了3个空间,如果二叉树的深度更大,那么开辟的无用空间则越多。
3.2 二叉树的顺序存储操作
顺序存储中我们定义结点数据类型为int,用一维数组存储二叉树数据,基本定义如下:
#define OK 1
#define ERROR 0
#define TRUE 1
#define FALSE 0
#define MAX_TREE_SIZE 100 /* 二叉树的最大结点数 */
typedef int Status; /* Status是函数的类型,其值是函数结果状态代码,如OK等 */
typedef int CElemType; /* 树结点的数据类型,目前暂定为整型 */
typedef CElemType SqBiTree[MAX_TREE_SIZE]; /* 0号单元存储根结点 */
CElemType Nil = 0; /*设整型以0为空 或者以 INT_MAX(65535)*/
typedef struct {
int level; //结点层
int order; //本层的序号(按照满二叉树给定序号规则)
}Position;
3.2.1 二叉树的构造及初始化
二叉树构造:
构造二叉树时,我们需要将存储二叉树的数据初始化,设置初始值。
// 构造空二叉树T,因为T是固定数组,不会改变.
Status InitBiTree(SqBiTree T){
for (int i = 0; i < MAX_TREE_SIZE; i++) {
//将二叉树初始化值置空
T[i] = Nil;
}
return OK;
}
二叉树初始化:
在初始化过程中,我们将二叉树的存储位置进行赋值,这里直接进行循环赋值了。
// 按层序次序输入二叉树中的结点值(字符型或整型),构造顺序存储的二叉树T
Status CreateBiTree(SqBiTree T){
int i = 0;
while (i < 10) {
T[i] = i+1;
printf("%d ",T[i]);
//结点不为空,且无双亲结点,此判断针对手动数据数值方式
if (i != 0 && T[(i+1)/2-1] == Nil && T[i] != Nil) {
printf("出现无双亲的非根结点%d\n",T[i]);
exit(ERROR);
}
i++;
}
//将空赋值给T的后面的结点
while (i < MAX_TREE_SIZE) {
T[i] = Nil;
i++;
}
return OK;
}
3.2.2 获取二叉树的深度
/* 获取二叉树的深度
初始条件: 二叉树已存在
操作结果: 返回二叉树T深度;
*/
int BiTreeDepth(SqBiTree T){
int j = -1;
int i;
//倒序查找最后一个结点的位置
for (i = MAX_TREE_SIZE-1 ; i>=0; i--) {
if (T[i] != Nil)
break;
}
do {
j++;
} while ( powl(2, j) <= i); //计算2的次幂
return j;
}
3.2.3 获取二叉树的结点值
思路:
- 根据已知的位置Position,找到结点所在的层,以及该层对应的序号(按照满二叉树给定序号规则)。
- 每层首个结点的序号为:序号 = 2level-1, level代表指定的层,即Position.level。
- 找到层首结点序号后,加上指定的Position.order,由于行序号是从1开始算的,所以还需要再减去1.
- 找到要查找结点的序号后,将其转换为数组下标,即减1,然后在数组中读取数据。
代码实现:
/* 返回处于位置e(层,本层序号)的结点值,比如e(3,2),第3层第2个结点。
初始条件: 二叉树T存在,e是T中某个结点(的位置)
操作结构: 返回处于位置e(层,本层序号)的结点值
*/
CElemType Value(SqBiTree T,Position e){
/*
Position.level -> 结点层.表示第几层;
Position.order -> 本层的序号(按照满二叉树给定序号规则)
*/
//pow(2,e.level-1) 找到层序
printf("%d\n",(int)pow(2,e.level-1));
//e.order
printf("%d\n",e.order);
//4+2-2;
return T[(int)pow(2, e.level-1)+e.order-1-1];
}
3.2.4 给二叉树指定结点赋值
思路:
- 找到指定结点的序号,然后转化成数组下标。
- 判断该结点的双亲是否存在,若不存在,则该结点为非法结点,返回error。
- 若该赋值的结点是一个双亲结点,也就是有孩子,那么该结点不能赋空值,如果赋空值,返回error。
- 更换数组指定位置的数据,返回OK。
代码实现:
/*
给处于位置e的结点赋值
初始条件: 二叉树存在,e是T中某个结点的位置
操作结果: 给处于位置e的结点赋值Value;
*/
Status Assign(SqBiTree T,Position e,CElemType value){
//找到当前e在数组中的具体位置索引
int i = (int)powl(2, e.level-1)+e.order -2;
//叶子结点的双亲为空
if (value != Nil && T[(i+1)/2-1] == Nil) {
return ERROR;
}
//给双亲赋空值但是有叶子结点
if (value == Nil && (T[i*2+1] != Nil || T[i*2+2] != Nil)) {
return ERROR;
}
T[i] = value;
return OK;
}
3.2.5 二叉树其他操作
1. 根据指定结点获取左孩子
/*
获取某个结点的左孩子;
初始条件:二叉树T存在,e是某个结点
操作结果:返回e的左孩子,若e无左孩子,则返回"空"
*/
CElemType LeftChild(SqBiTree T,CElemType e){
//空树
if (T[0] == Nil) {
return Nil;
}
for (int i = 0 ; i < MAX_TREE_SIZE-1; i++) {
//找到e
if (T[i] == e) {
return T[i*2+1];
}
}
//没有找到
return Nil;
}
2. 根据指定结点获取右孩子
/*
获取某个结点的右孩子;
初始条件:二叉树T存在,e是某个结点
操作结果:返回e的左孩子,若e无左孩子,则返回"空"
*/
CElemType RightChild(SqBiTree T,CElemType e){
//空树
if (T[0] == Nil) {
return Nil;
}
for (int i = 0 ; i < MAX_TREE_SIZE-1; i++) {
//找到e
if (T[i] == e) {
return T[i*2+2];
}
}
//没有找到
return Nil;
}
3. 根据指定结点获取做兄弟
/*
获取结点的左兄弟
初始条件: 二叉树T存在,e是T中某个结点
操作结果: 返回e的左兄弟。若e是T的左孩子或无左兄弟,则返回"空"
*/
CElemType LeftSibling(SqBiTree T,CElemType e)
{
/* 空树 */
if(T[0]==Nil)
return Nil;
for(int i=1;i<=MAX_TREE_SIZE-1;i++)
/* 找到e且其序号为偶数(是右孩子) */
if(T[i]==e&&i%2==0)
return T[i-1];
return Nil; /* 没找到e */
}
4. 根据指定结点获取有兄弟
/*获取结点的右兄弟
初始条件: 二叉树T存在,e是T中某个结点
操作结果: 返回e的右兄弟。若e是T的右孩子或无右兄弟,则返回"空"
*/
CElemType RightSibling(SqBiTree T,CElemType e)
{
/* 空树 */
if(T[0]==Nil)
return Nil;
for(int i=1;i<=MAX_TREE_SIZE-1;i++)
/* 找到e且其序号为奇数(是左孩子) */
if(T[i]==e&&i%2==1)
return T[i+1];
return Nil; /* 没找到e */
}
5. 根据指定结点获取双亲
/*
获取e的双亲;
初始条件: 二叉树存在,e是T中的某一个结点
操作结果: 若e是T的非根结点, 则返回它的双亲,否则返回"空"
*/
CElemType Parent(SqBiTree T, CElemType e){
//空树
if (T[0] == Nil) {
return Nil;
}
for (int i = 1 ; i < MAX_TREE_SIZE; i++) {
//找到e
if (T[i] == e) {
return T[(i+1)/2 - 1];
}
}
//没有找到
return Nil;
}
3.3 顺序存储的二叉树遍历方法
⼆叉树的遍是指的从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次。
二叉树的遍历方式有很多种,如果我们限制了从左到右的方式,那么主要分为以下四种。
3.3.1 层序法
规则:若树为空树,则直接返回,否则从树的第一层,即根结点开始访问,从上而下逐层遍历,在同一层中,从左到右的顺序逐个访问每个结点,如下图所示,遍历的顺序为:ABCDEFGHI。
代码实现:
// 层序遍历二叉树
void LevelOrderTraverse(SqBiTree T){
if (T[0] == Nil) return;
int i = MAX_TREE_SIZE-1;
//找到最后一个非空结点的序号
while (T[i] == Nil) i--;
//从根结点起,按层序遍历二叉树
for (int j = 0; j <= i; j++)
//只遍历非空结点
if (T[j] != Nil)
printf("%d ",T[j]);
printf("\n");
}
3.3.2 前序法
规则:若树为空树,则直接返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树,如下图所示,遍历的顺序为:ABDGHCEIF。
代码实现:
// 前序遍历二叉树
void PreTraverse(SqBiTree T,int e){
//打印结点数据
printf("%d ",T[e]);
//先序遍历左子树
if (T[2 * e + 1] != Nil) {
PreTraverse(T, 2*e+1);
}
//最后先序遍历右子树
if (T[2 * e + 2] != Nil) {
PreTraverse(T, 2*e+2);
}
}
Status PreOrderTraverse(SqBiTree T){
//树不为空
if (T[0] != Nil) {
PreTraverse(T, 0);
}
printf("\n");
return OK;
}
3.3.3 中序法
规则:若树为空树,则直接返回,否则从根结点开始(注意并不是先访问根结点),中序遍历根结点的左子树,然后访问根结点,最后中序遍历右子树,如下图所示,遍历的顺序为:GDHBAEICF。
代码实现:
// 中序遍历
void InTraverse(SqBiTree T, int e){
/* 左子树不空 */
if (T[2*e+1] != Nil)
InTraverse(T, 2*e+1);
printf("%d ",T[e]);
/* 右子树不空 */
if (T[2*e+2] != Nil)
InTraverse(T, 2*e+2);
}
Status InOrderTraverse(SqBiTree T){
/* 树不空 */
if (T[0] != Nil) {
InTraverse(T, 0);
}
printf("\n");
return OK;
}
3.3.4 后序法
规则:若树为空树,则直接返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后访问根结点,如下图所示,遍历的顺序为:GHDBIEFCA。
代码实现:
// 后序遍历
void PostTraverse(SqBiTree T,int e)
{ /* 左子树不空 */
if(T[2*e+1]!=Nil)
PostTraverse(T,2*e+1);
/* 右子树不空 */
if(T[2*e+2]!=Nil)
PostTraverse(T,2*e+2);
printf("%d ",T[e]);
}
Status PostOrderTraverse(SqBiTree T)
{
if(T[0] != Nil) /* 树不空 */
PostTraverse(T,0);
printf("\n");
return OK;
}
4. 二叉树链式存储
4.1 二叉树的链式存储结构
由上面我们可知,采用顺序存储的方式存储二叉树,很多时候会浪费很多内存资源,很不划算,因此我们考虑用链式存储的方式进行存储。
二叉树中每个结点最多有两个孩子,所以为它设计一个数据域和两个指针域比较合理,我们称这样的链表为二叉链表。如下图所示:
其中data是数据域,lchild和rchild都是指针域,分别存放指向左孩子和右孩子的指针。
二叉链表的结点定义如下:
typedef char CElemType;
CElemType Nil=' '; /* 字符型以空格符为空 */
typedef struct BiTNode /* 结点结构 */
{
CElemType data; /* 结点数据 */
struct BiTNode *lchild,*rchild; /* 左右孩子指针 */
}BiTNode,*BiTree;
4.2 二叉树的链式存储操作
如何创建一个二叉链表呢?首先我们先了解一个新概念—扩展二叉树。
扩展二叉树就是将二叉树中每个结点的空指针引出一个虚结点,设其值为一个固定的值,比如“#”,我们称这种处理过的二叉树为原二叉树的扩展二叉树,这样就能让每个结点确认是否有左右孩子。
扩展二叉树可以做到一个遍历序列确定一棵二叉树了,比如下图中,图1的前序遍历为:ABDC,如果只知道ABDC,我们是无法确定一个二叉树的,会有多种形态。图2的前序遍历为:AB#D##C##,通过这个顺序我们可以确定一个唯一的二叉树。
4.2.1 二叉链表的构造与销毁
通过上面的前序遍历序列AB#D##C##,我们就可以用键盘输入,创建二叉链表了。
构造:
/*创建二叉树
按前序输入二叉树中的结点值(字符),#表示空树;
*/
void CreateBiTree(BiTree *T){
CElemType ch;
scanf("%c", &ch);
//判断当前字符是否为'#'
if (ch == '#') {
*T = NULL;
}else
{
//创建新的结点
*T = (BiTree)malloc(sizeof(BiTNode));
//是否创建成功
if (!*T) {
exit(OVERFLOW);
}
/* 生成根结点 */
(*T)->data = ch;
/* 构造左子树 */
CreateBiTree(&(*T)->lchild);
/* 构造右子树 */
CreateBiTree(&(*T)->rchild);
}
}
上面我们是通过前序遍历法构造的二叉树,当然,我们还可以通过中序和后续遍历法构造二叉树,只是输入字符的顺序需要改变。
销毁:销毁二叉树,我们需要采用后序遍历方法进行逐个结点释放。
// 销毁二叉树
void DestroyBiTree(BiTree *T)
{
if(*T)
{
/* 有左孩子 */
if((*T)->lchild)
DestroyBiTree(&(*T)->lchild); /* 销毁左孩子子树 */
/* 有右孩子 */
if((*T)->rchild)
DestroyBiTree(&(*T)->rchild); /* 销毁右孩子子树 */
free(*T); /* 释放根结点 */
*T=NULL; /* 空指针赋0 */
}
}
4.2.2 获取二叉链表的深度
链式存储的二叉树,我们在计算深度的时候,需要分别计算左子树和右子树的深度,然后取二者的较大值。
/*
二叉树T的深度
初始条件: 二叉树T存在
操作结果: 返回T的深度
*/
int BiTreeDepth(BiTree T){
int i,j;
if(!T)
return 0;
//计算左孩子的深度
if(T->lchild)
i=BiTreeDepth(T->lchild);
else
i=0;
//计算右孩子的深度
if(T->rchild)
j=BiTreeDepth(T->rchild);
else
j=0;
//比较i和j
return i>j?i+1:j+1;
}
4.3 二叉链表的遍历方法
二叉树的遍历方法我们在文中顺序存储部分已经了解到,二叉链表的遍历方法原理规则和上文是一样的,只是算法有些不同。
4.3.1 前序法
/*
前序递归遍历T
初始条件:二叉树T存在;
操作结果: 前序递归遍历T
*/
void PreOrderTraverse(BiTree T)
{
if(T==NULL)
return;
printf("%c",T->data);/* 显示结点数据,可以更改为其它对结点操作 */
PreOrderTraverse(T->lchild); /* 再先序遍历左子树 */
PreOrderTraverse(T->rchild); /* 最后先序遍历右子树 */
}
4.3.2 中序法
/*
中序递归遍历T
初始条件:二叉树T存在;
操作结果: 中序递归遍历T
*/
void InOrderTraverse(BiTree T)
{
if(T==NULL)
return ;
InOrderTraverse(T->lchild); /* 中序遍历左子树 */
printf("%c",T->data);/* 显示结点数据,可以更改为其它对结点操作 */
InOrderTraverse(T->rchild); /* 最后中序遍历右子树 */
}
4.3.3 后序法
/*
后序递归遍历T
初始条件:二叉树T存在;
操作结果: 中序递归遍历T
*/
void PostOrderTraverse(BiTree T)
{
if(T==NULL)
return;
PostOrderTraverse(T->lchild); /* 先后序遍历左子树 */
PostOrderTraverse(T->rchild); /* 再后序遍历右子树 */
printf("%c",T->data);/* 显示结点数据,可以更改为其它对结点操作 */
}
关于二叉链表的其他操作,后续还会再更新。
更多阅读文章:
数据结构与算法之概述
线性表的顺序存储结构
线性表的链式存储结构-单链表及循环链表
线性表的链式存储结构-双向链表及双向循环链表
限定性线性表—栈(顺序存储及链式存储)