树的概念及二叉树

1. 树的概念

之前的文章,我们了解了一对一的线性结构的概念及一些操作,而这篇文章我们了解一下一对多的树形结构。

1.1 树的定义

树是n(n≥0)个结点的有限集。
在任何一个非空树中:
①:有且仅有一个特定的称为根的结点。
②:当n>1时,其余结点可分为m(m>0)个互不相交的有限集,其中每个集合本身又是一棵树,并且称为根的子树。
树的示意图如下:
子树示意图.png
上图中子树T1和子树T2都是结点A的子树,D、H、I组成的树又是B结点的子树,E、F、G、J组成的树又是C结点的子树。

1.2 结点分类

树的结点包含一个数据元素以及若干指向其子树的分支。结点拥有的子树数量称为结点的度。度为0的结点称为叶子结点或终端结点,度不为0的结点称为分支结点或非终端结点。除了根节点外,分支结点也称为内部结点。树的度是树内结点的度的最大值。
下图中,这棵树中C结点的度最大,为3,因此这棵树的度为3。
结点分类.png

1.3 结点间关系

双亲和孩子:结点的子树的根称为该结点的孩子,相应的,该结点称为孩子的双亲,如下图中C的双亲为A,C的孩子有E、F和G。
兄弟:同一个双亲的孩子之间称为兄弟,如下图中的E、F和G。
祖先:从根到该结点所经历的分支上的所有结点,如下图中的J的祖先为A、C、E。
子孙:以某点为根的子树中的任一结点都称为该结点的子孙。如下图中的B的子孙有D、H、I。
堂兄弟:双亲在同一层的结点互为堂兄弟,如下图中的D、E。
结点关系图.png

1.4 其他相关概念

层次:结点的层次从根结点开始定义起,根为第一层,根的孩子为第二层。树中任一层次等于双亲结点的层次加1。
结点的高度:结点到叶子结点的最长路径(边数)。
结点的深度:根结点到这个节点所经历的边的个数。
树的高度:根结点的高度。
如果将树中结点的各子树堪称从左至右是有次序的,不能互换的,则称该树为有序树,否则为无序树。
数的其他概念.png

2. 二叉树概念

2.1 二叉树定义

二叉树是n(n≥0)个结点的有限集合,该集合或者为空集(空二叉树),或者由一个根结点和两个互不相交的、分别称为根结点左子树和右子树的二叉树组成。
如下图中,图一是一个正确的二叉树,图二则不是二叉树,因为C结点有3个孩子。
二叉树示意图.png
二叉树的特点

  1. 每个结点最多有两个子树,所以二叉树中不存在度大于2的结点。
  2. 左子树和右子树是有顺序的,次序不能颠倒。
  3. 即使树中只有一颗子树,也要区分是左子树还是右子树。

二叉树的五种形态

  1. 空二叉树。
  2. 只有一个根结点。
  3. 根结点只有左子树。
  4. 根结点只有右子树。
  5. 根结点既有左子树,又有右子树。

如果二叉树不为空,且有3个结点,那么其形态如下图:
二叉树5形态.png

2.2 特殊二叉树

2.2.1 斜树

斜树一定是斜的,所有的结点都只有左子树叫做左斜树,所有的结点都只有右子树叫做右斜树,左斜树和右斜树统称为斜树。
上图中树2和树3就是斜树。

2.2.2 满二叉树

在一棵二叉树中,所有的分支结点都有左子树和右子树,并且所有的叶子结点都在同一层上,这样的二叉树称为满二叉树。如下图所示:
满二叉树示意图.png
满二叉树有特点

  1. 叶子结点只能出现在最下一层,出现在其他层就不能达到平衡,也就不是满二叉树了。
  2. 非叶子结点的度一定是2,如果有不是2的,那么此树就不是二叉树了。
  3. 在同样深度的二叉树中,满二叉树的结点个数最多,叶子结点最多。

2.2.3 完全二叉树

对于一棵具有n个结点的二叉树按照层序编号,如果编号为i(1≤i≤n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵树称为完全二叉树。如下图所示:
完全二叉树示意图.png
上图中:

  1. 如果没有结点6、结点7,而结点8、结点9仍存在,即结点3无孩子,那么这棵树就不是完全二叉树。
  2. 如果没有结点8,而结点9仍存在,即结点4只有右孩子,那么这棵树就不是完全二叉树。

完全二叉树特点

  1. 叶子结点只能出现在最下两层。
  2. 最下一层的叶子结点一定集中在左侧连续位置。
  3. 倒数第二层,如果有叶子结点,一定都集中在右侧连续位置。
  4. 如果结点度为1,那么只能有左孩子。
  5. 同样结点数的二叉树,完全二叉树的深度最小。

2.3 二叉树性质

  1. 在二叉树的第i层上最多有2i-1个结点(i≥1)。
  2. 深度为k的二叉树最多有2k-1个结点(k≥1)。
  3. 对于任何一个二叉树,如果其叶子结点数为n0,度数为2的结点数为n2,那么n0=n2+1,也就是叶子结点数为度为2的结点数加1。
  4. 具有n个结点的完全二叉树深度为(log2n)+1。
  5. 对具有n个结点的完全二叉树,如果按照从上至下和从左至右的顺序对二叉树的所有结点从1开始编号,则对于任意的序号为i的结点有:
    A. 如果i>1,那么序号为i的结点的双亲结点序号为i/2;
    B. 如果i=1,那么序号为i的结点为根节点,无双亲结点;
    C. 如果2i<=n,那么序号为i的结点的左孩子结点序号为2i;
    D. 如果2i>n,那么序号为i的结点无左孩子;
    E. 如果2i+1<=n,那么序号为i的结点右孩子序号为2i+1;
    F. 如果2i+1>n,那么序号为i的结点无右孩子。

3. 二叉树顺序存储

3.1 二叉树的顺序存储结构

二叉树的顺序存储结构用一维数组存储二叉树中的结点,并且结点的存储位置,即数组的下标要能体现结点之间的逻辑关系,比如双亲与孩子,兄弟之间的关系等。

1. 完全二叉树的存储:
完全二叉树数组示意图.png
对于完全二叉树,用顺序结构可以表现出二叉树的结构来。

2. 一般二叉树存储
对于一般二叉树,我们把不存在的结点设置为"^",下图中橘色为不存在的结点。
斜树存储数组.png
上图为深度为3的右斜树,我们看到数组开辟了7个空间,但是实际却只用了3个空间,如果二叉树的深度更大,那么开辟的无用空间则越多。

3.2 二叉树的顺序存储操作

顺序存储中我们定义结点数据类型为int,用一维数组存储二叉树数据,基本定义如下:

#define OK 1
#define ERROR 0
#define TRUE 1
#define FALSE 0

#define MAX_TREE_SIZE 100 /* 二叉树的最大结点数 */

typedef int Status;        /* Status是函数的类型,其值是函数结果状态代码,如OK等 */
typedef int CElemType;      /* 树结点的数据类型,目前暂定为整型 */
typedef CElemType SqBiTree[MAX_TREE_SIZE]; /* 0号单元存储根结点  */
CElemType Nil = 0;   /*设整型以0为空 或者以 INT_MAX(65535)*/

typedef struct {
    int level; //结点层
    int order; //本层的序号(按照满二叉树给定序号规则)
}Position;

3.2.1 二叉树的构造及初始化

二叉树构造
构造二叉树时,我们需要将存储二叉树的数据初始化,设置初始值。

// 构造空二叉树T,因为T是固定数组,不会改变.
Status InitBiTree(SqBiTree T){
    for (int i = 0; i < MAX_TREE_SIZE; i++) {
        //将二叉树初始化值置空
        T[i] = Nil;
    }
    return OK;
}

二叉树初始化
在初始化过程中,我们将二叉树的存储位置进行赋值,这里直接进行循环赋值了。

// 按层序次序输入二叉树中的结点值(字符型或整型),构造顺序存储的二叉树T
Status CreateBiTree(SqBiTree T){
    int i = 0;
    while (i < 10) {
        T[i] = i+1;
        printf("%d ",T[i]);
        //结点不为空,且无双亲结点,此判断针对手动数据数值方式
        if (i != 0 && T[(i+1)/2-1] == Nil && T[i] != Nil) {
            printf("出现无双亲的非根结点%d\n",T[i]);
            exit(ERROR);
        }
        i++;
    }
    //将空赋值给T的后面的结点
    while (i < MAX_TREE_SIZE) {
        T[i] = Nil;
        i++;
    }
    return OK;
}

3.2.2 获取二叉树的深度

/* 获取二叉树的深度
 初始条件: 二叉树已存在
 操作结果: 返回二叉树T深度;
 */
int BiTreeDepth(SqBiTree T){
    int j = -1;
    int i;
    //倒序查找最后一个结点的位置
    for (i = MAX_TREE_SIZE-1 ; i>=0; i--) {
        if (T[i] != Nil)
            break;
    }
    do {
        j++;
    } while ( powl(2, j) <= i); //计算2的次幂
    return j;
}

3.2.3 获取二叉树的结点值

思路

  1. 根据已知的位置Position,找到结点所在的层,以及该层对应的序号(按照满二叉树给定序号规则)。
  2. 每层首个结点的序号为:序号 = 2level-1, level代表指定的层,即Position.level。
  3. 找到层首结点序号后,加上指定的Position.order,由于行序号是从1开始算的,所以还需要再减去1.
  4. 找到要查找结点的序号后,将其转换为数组下标,即减1,然后在数组中读取数据。

代码实现

/* 返回处于位置e(层,本层序号)的结点值,比如e(3,2),第3层第2个结点。
 初始条件: 二叉树T存在,e是T中某个结点(的位置)
 操作结构: 返回处于位置e(层,本层序号)的结点值
 */
CElemType Value(SqBiTree T,Position e){
    /*
     Position.level -> 结点层.表示第几层;
     Position.order -> 本层的序号(按照满二叉树给定序号规则)
     */
    //pow(2,e.level-1) 找到层序
    printf("%d\n",(int)pow(2,e.level-1));
    
    //e.order
    printf("%d\n",e.order);
    
    //4+2-2;
    return T[(int)pow(2, e.level-1)+e.order-1-1];
}

3.2.4 给二叉树指定结点赋值

思路

  1. 找到指定结点的序号,然后转化成数组下标。
  2. 判断该结点的双亲是否存在,若不存在,则该结点为非法结点,返回error。
  3. 若该赋值的结点是一个双亲结点,也就是有孩子,那么该结点不能赋空值,如果赋空值,返回error。
  4. 更换数组指定位置的数据,返回OK。

代码实现

/*
 给处于位置e的结点赋值
 初始条件: 二叉树存在,e是T中某个结点的位置
 操作结果: 给处于位置e的结点赋值Value;
 */
Status Assign(SqBiTree T,Position e,CElemType value){
    //找到当前e在数组中的具体位置索引
    int i = (int)powl(2, e.level-1)+e.order -2;
    //叶子结点的双亲为空
    if (value != Nil &&  T[(i+1)/2-1] == Nil) {
        return ERROR;
    }
    //给双亲赋空值但是有叶子结点
    if (value == Nil && (T[i*2+1] != Nil || T[i*2+2] != Nil)) {
        return  ERROR;
    }
    T[i] = value;
    return OK;
}

3.2.5 二叉树其他操作

1. 根据指定结点获取左孩子

/*
 获取某个结点的左孩子;
 初始条件:二叉树T存在,e是某个结点
 操作结果:返回e的左孩子,若e无左孩子,则返回"空"
 */
CElemType LeftChild(SqBiTree T,CElemType e){
    //空树
    if (T[0] == Nil) {
        return Nil;
    }
    for (int i = 0 ; i < MAX_TREE_SIZE-1; i++) {
        //找到e
        if (T[i] == e) {
            return T[i*2+1];
        }
    }
    //没有找到
    return Nil;
}

2. 根据指定结点获取右孩子

/*
 获取某个结点的右孩子;
 初始条件:二叉树T存在,e是某个结点
 操作结果:返回e的左孩子,若e无左孩子,则返回"空"
 */
CElemType RightChild(SqBiTree T,CElemType e){
    //空树
    if (T[0] == Nil) {
        return Nil;
    }
    for (int i = 0 ; i < MAX_TREE_SIZE-1; i++) {
        //找到e
        if (T[i] == e) {
            return T[i*2+2];
        }
    }
    //没有找到
    return Nil;
}

3. 根据指定结点获取做兄弟

/*
 获取结点的左兄弟
 初始条件:  二叉树T存在,e是T中某个结点
 操作结果: 返回e的左兄弟。若e是T的左孩子或无左兄弟,则返回"空"
 */
CElemType LeftSibling(SqBiTree T,CElemType e)
{
    /* 空树 */
    if(T[0]==Nil)
        return Nil;
    
    for(int i=1;i<=MAX_TREE_SIZE-1;i++)
    /* 找到e且其序号为偶数(是右孩子) */
        if(T[i]==e&&i%2==0)
            return T[i-1];
    return Nil; /* 没找到e */
}

4. 根据指定结点获取有兄弟

/*获取结点的右兄弟
 初始条件: 二叉树T存在,e是T中某个结点
 操作结果: 返回e的右兄弟。若e是T的右孩子或无右兄弟,则返回"空"
 */
CElemType RightSibling(SqBiTree T,CElemType e)
{
    /* 空树 */
    if(T[0]==Nil)
        return Nil;
    
    for(int i=1;i<=MAX_TREE_SIZE-1;i++)
    /* 找到e且其序号为奇数(是左孩子) */
        if(T[i]==e&&i%2==1)
            return T[i+1];
    return Nil; /* 没找到e */
}

5. 根据指定结点获取双亲

/*
 获取e的双亲;
 初始条件: 二叉树存在,e是T中的某一个结点
 操作结果: 若e是T的非根结点, 则返回它的双亲,否则返回"空"
 */
CElemType Parent(SqBiTree T, CElemType e){
    //空树
    if (T[0] == Nil) {
        return Nil;
    }
    for (int i = 1 ; i < MAX_TREE_SIZE; i++) {
        //找到e
        if (T[i] == e) {
            return T[(i+1)/2 - 1];
        }
    }
    //没有找到
    return Nil;
}

3.3 顺序存储的二叉树遍历方法

⼆叉树的遍是指的从根结点出发,按照某种次序依次访问二叉树中所有结点,使得每个结点被访问一次且仅被访问一次。
二叉树的遍历方式有很多种,如果我们限制了从左到右的方式,那么主要分为以下四种。

3.3.1 层序法

规则:若树为空树,则直接返回,否则从树的第一层,即根结点开始访问,从上而下逐层遍历,在同一层中,从左到右的顺序逐个访问每个结点,如下图所示,遍历的顺序为:ABCDEFGHI。
层序排序法.png
代码实现

// 层序遍历二叉树
void LevelOrderTraverse(SqBiTree T){
    if (T[0] == Nil) return;
    int i = MAX_TREE_SIZE-1;
    //找到最后一个非空结点的序号
    while (T[i] == Nil) i--;
    //从根结点起,按层序遍历二叉树
    for (int j = 0; j <= i; j++)
        //只遍历非空结点
        if (T[j] != Nil)
            printf("%d ",T[j]);
    printf("\n");
}

3.3.2 前序法

规则:若树为空树,则直接返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树,如下图所示,遍历的顺序为:ABDGHCEIF。
前序排序法.png
代码实现

// 前序遍历二叉树
void PreTraverse(SqBiTree T,int e){
    //打印结点数据
    printf("%d ",T[e]);
    //先序遍历左子树
    if (T[2 * e + 1] != Nil) {
        PreTraverse(T, 2*e+1);
    }
    //最后先序遍历右子树
    if (T[2 * e + 2] != Nil) {
        PreTraverse(T, 2*e+2);
    }
}

Status PreOrderTraverse(SqBiTree T){
    //树不为空
    if (T[0] != Nil) {
        PreTraverse(T, 0);
    }
    printf("\n");
    return  OK;
}

3.3.3 中序法

规则:若树为空树,则直接返回,否则从根结点开始(注意并不是先访问根结点),中序遍历根结点的左子树,然后访问根结点,最后中序遍历右子树,如下图所示,遍历的顺序为:GDHBAEICF。
中序排序法.png
代码实现

// 中序遍历
void InTraverse(SqBiTree T, int e){
    /* 左子树不空 */
    if (T[2*e+1] != Nil)
        InTraverse(T, 2*e+1);
    printf("%d ",T[e]);
    /* 右子树不空 */
    if (T[2*e+2] != Nil)
        InTraverse(T, 2*e+2);
}

Status InOrderTraverse(SqBiTree T){
    /* 树不空 */
    if (T[0] != Nil) {
        InTraverse(T, 0);
    }
    printf("\n");
    return OK;
}

3.3.4 后序法

规则:若树为空树,则直接返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后访问根结点,如下图所示,遍历的顺序为:GHDBIEFCA。
后序排序法.png
代码实现

// 后序遍历
void PostTraverse(SqBiTree T,int e)
{   /* 左子树不空 */
    if(T[2*e+1]!=Nil)
        PostTraverse(T,2*e+1);
    /* 右子树不空 */
    if(T[2*e+2]!=Nil)
        PostTraverse(T,2*e+2);
    printf("%d ",T[e]);
}
Status PostOrderTraverse(SqBiTree T)
{
    if(T[0] != Nil) /* 树不空 */
        PostTraverse(T,0);
    printf("\n");
    return OK;
}

4. 二叉树链式存储

4.1 二叉树的链式存储结构

由上面我们可知,采用顺序存储的方式存储二叉树,很多时候会浪费很多内存资源,很不划算,因此我们考虑用链式存储的方式进行存储。

二叉树中每个结点最多有两个孩子,所以为它设计一个数据域和两个指针域比较合理,我们称这样的链表为二叉链表。如下图所示:
二叉链表结点.png

其中data是数据域,lchild和rchild都是指针域,分别存放指向左孩子和右孩子的指针。

二叉链表的结点定义如下:

typedef char CElemType;
CElemType Nil=' '; /* 字符型以空格符为空 */
typedef struct BiTNode  /* 结点结构 */
{
    CElemType data;        /* 结点数据 */
    struct BiTNode *lchild,*rchild; /* 左右孩子指针 */
}BiTNode,*BiTree;

4.2 二叉树的链式存储操作

如何创建一个二叉链表呢?首先我们先了解一个新概念—扩展二叉树

扩展二叉树就是将二叉树中每个结点的空指针引出一个虚结点,设其值为一个固定的值,比如“#”,我们称这种处理过的二叉树为原二叉树的扩展二叉树,这样就能让每个结点确认是否有左右孩子。

扩展二叉树可以做到一个遍历序列确定一棵二叉树了,比如下图中,图1的前序遍历为:ABDC,如果只知道ABDC,我们是无法确定一个二叉树的,会有多种形态。图2的前序遍历为:AB#D##C##,通过这个顺序我们可以确定一个唯一的二叉树。
扩展二叉树.png

4.2.1 二叉链表的构造与销毁

通过上面的前序遍历序列AB#D##C##,我们就可以用键盘输入,创建二叉链表了。
构造

/*创建二叉树
 按前序输入二叉树中的结点值(字符),#表示空树;
 */
void CreateBiTree(BiTree *T){
    CElemType ch;
    scanf("%c", &ch);
    //判断当前字符是否为'#'
    if (ch == '#') {
        *T = NULL;
    }else
    {
        //创建新的结点
        *T = (BiTree)malloc(sizeof(BiTNode));
        //是否创建成功
        if (!*T) {
            exit(OVERFLOW);
        }
        /* 生成根结点 */
        (*T)->data = ch;
        /* 构造左子树 */
        CreateBiTree(&(*T)->lchild);
        /* 构造右子树 */
        CreateBiTree(&(*T)->rchild);
    }
}

上面我们是通过前序遍历法构造的二叉树,当然,我们还可以通过中序和后续遍历法构造二叉树,只是输入字符的顺序需要改变。

销毁:销毁二叉树,我们需要采用后序遍历方法进行逐个结点释放。

// 销毁二叉树
void DestroyBiTree(BiTree *T)
{
    if(*T)
    {
        /* 有左孩子 */
        if((*T)->lchild)
            DestroyBiTree(&(*T)->lchild); /* 销毁左孩子子树 */
        
        /* 有右孩子 */
        if((*T)->rchild)
            DestroyBiTree(&(*T)->rchild); /* 销毁右孩子子树 */
        
        free(*T); /* 释放根结点 */
        *T=NULL; /* 空指针赋0 */
    }
}

4.2.2 获取二叉链表的深度

链式存储的二叉树,我们在计算深度的时候,需要分别计算左子树和右子树的深度,然后取二者的较大值。

/*
 二叉树T的深度
 初始条件: 二叉树T存在
 操作结果: 返回T的深度
 */
int BiTreeDepth(BiTree T){
    int i,j;
    if(!T)
        return 0;
    //计算左孩子的深度
    if(T->lchild)
        i=BiTreeDepth(T->lchild);
    else
        i=0;
    
    //计算右孩子的深度
    if(T->rchild)
        j=BiTreeDepth(T->rchild);
    else
        j=0;
    //比较i和j
    return i>j?i+1:j+1;
}

4.3 二叉链表的遍历方法

二叉树的遍历方法我们在文中顺序存储部分已经了解到,二叉链表的遍历方法原理规则和上文是一样的,只是算法有些不同。

4.3.1 前序法

/*
 前序递归遍历T
 初始条件:二叉树T存在;
 操作结果: 前序递归遍历T
 */
void PreOrderTraverse(BiTree T)
{
    if(T==NULL)
        return;
    printf("%c",T->data);/* 显示结点数据,可以更改为其它对结点操作 */
    PreOrderTraverse(T->lchild); /* 再先序遍历左子树 */
    PreOrderTraverse(T->rchild); /* 最后先序遍历右子树 */
}

4.3.2 中序法

/*
 中序递归遍历T
 初始条件:二叉树T存在;
 操作结果: 中序递归遍历T
 */
void InOrderTraverse(BiTree T)
{
    if(T==NULL)
        return ;
    InOrderTraverse(T->lchild); /* 中序遍历左子树 */
    printf("%c",T->data);/* 显示结点数据,可以更改为其它对结点操作 */
    InOrderTraverse(T->rchild); /* 最后中序遍历右子树 */
}

4.3.3 后序法

/*
 后序递归遍历T
 初始条件:二叉树T存在;
 操作结果: 中序递归遍历T
 */
void PostOrderTraverse(BiTree T)
{
    if(T==NULL)
        return;
    PostOrderTraverse(T->lchild); /* 先后序遍历左子树  */
    PostOrderTraverse(T->rchild); /* 再后序遍历右子树  */
    printf("%c",T->data);/* 显示结点数据,可以更改为其它对结点操作 */
}

关于二叉链表的其他操作,后续还会再更新。

更多阅读文章:
数据结构与算法之概述
线性表的顺序存储结构
线性表的链式存储结构-单链表及循环链表
线性表的链式存储结构-双向链表及双向循环链表
限定性线性表—栈(顺序存储及链式存储)

你可能感兴趣的:(数据结构,树形结构,二叉树)