【数据结构与算法】——第五章:树与二叉树(1)

文章目录

      • 1、定义
        • 1.1 结点分类
        • 1.2 结点之间的关系
        • 1.3 树的其他概念
      • 2、树的存储结构
        • 2.1 双亲表示法
        • 2.2 孩子表示法
        • 2.3 孩子兄弟表示法

 ============================ 【说明】 ===================================================
  大家好,本专栏是 数据结构与算法该科目是计算机类专业必修课之一,比较重要也比较基础,有想从事算法研究的同学,这些内容是专/本科、甚至硕士期间较为基础的内容,适用范围较广:大学专业课学习、考研复习等。
  通过自己的理解进行整理,希望大家积极交流、探讨,多给意见。后面也会给大家更新其他一些知识。若有侵权,联系删除!共同维护网络知识权利!

1、定义

  前面主要讲的是一对一的线性结构,现在主要讨论关于一种一对多的数据结构—“树”。

【数据结构与算法】——第五章:树与二叉树(1)_第1张图片
  关于树的定义两点强调:
  1、n>0时根结点是唯一的,不可能存在多个根结点,别和现实中的大树混在一起,现实中的树有很多根须,那是真实的树,数据结构中的树是只能有一个根结点。
  2、m>0时,子树的个数没有限制,但它们一定是互不相交的。

1.1 结点分类

  树的结点包含一个数据元素若干指向其子树的分支。结点拥有的子树数称为结点的度(Degree)。
  度为0的结点称为叶结点(Leaf)或终端结点
  度不为0的结点称为非终端结点或分支结点
  除根结点之外,分支结点也称为内部结点
  树的度是树内各结点的度的最大值。
  如下图所示,因为这棵树结点的度的最大值是结点D的度,为3,所以树的度也为3。
【数据结构与算法】——第五章:树与二叉树(1)_第2张图片

1.2 结点之间的关系

  结点的子树的根称为该结点的孩子(Child)。相应地,该结点称为孩子的双亲 (Parent)。
  为什么不是父或母,叫双亲呢?对于结点来说其父母同体,唯一的一个,所以只能把它称为双亲了。
  同一个双亲的孩子之间互称
兄弟

  结点的祖先是从根到该结点所经分支上的所有结点。如下图,对于H来说,D、B、A都是它的祖先。
  以某结点为根的子树中的任一结点都称为该结点的子孙。B的子孙有D、G、H、I,如下图所示。
【数据结构与算法】——第五章:树与二叉树(1)_第3张图片

1.3 树的其他概念

  结点的层次(Level)从根开始定义起,根为第一层,根的孩子为第二层。若某结点在第l层,则其子树的根就在第l+ 1层。
  其双亲在同一层的结点互为堂兄弟。显然下图中的D、E、F是堂兄弟,而G、H、1、J也是。
  树中结点的最大层次称为树的深度(Depth)或高度,当前树的深度为4。
【数据结构与算法】——第五章:树与二叉树(1)_第4张图片
  如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树
  森林(Forest)是m (m≥0)棵互不相交的树的集合。对树中每个结点而言,其子树的集合即为森林。
  对比:
【数据结构与算法】——第五章:树与二叉树(1)_第5张图片

2、树的存储结构

  说到存储结构,就会想到我们前面章节讲过的顺序存储和链式存储两种结构。
  先来看看顺序存储结构,用一段地址连续的存储单元依次存储线性表的数据元素。这对于线性表来说是很自然的,对于树这样一多对的结构呢?
  思考:树中某个结点的孩子可以有多个,这就意味着,无论按何种顺序将树中所有结点存储到数组中,结点的存储位置都无法直接反映逻辑关系,你想想看,数据元素挨个的存储,谁是谁的双亲,谁是谁的孩子呢?简单的顺序存储结构是不能满足树的实现要求的。
  不过充分利用顺序存储和链式存储结构的特点,完全可以实现对树的存储结构的表示。
  我们这里要介绍三种不同的表示法双亲表示法孩子表示法孩子兄弟表示法

2.1 双亲表示法

  我们都不可能是从石头里蹦出来的,孙悟空显然不能算是人,所以是人一定会有父母。树这种结构也不例外,除了根结点外,其余每个结点,它不一定有孩子,但是一定有且仅有一个双亲。
  我们假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器(指针)指示其双亲结点到链表中的位置。也就是说,每个结点除了知道自己是谁以外,还知道它的双亲在哪里。

  它的结点结构如下表示:
【数据结构与算法】——第五章:树与二叉树(1)_第6张图片
  其中data是数据域,存储结点的数据信息。而parent是指针域,存储该结点的双亲在数组中的下标。
  例:
【数据结构与算法】——第五章:树与二叉树(1)_第7张图片【数据结构与算法】——第五章:树与二叉树(1)_第8张图片
注:由于根结点是没有双亲的,所以我们约定根结点的位置域设置为-1。这也就意味着,我们所有的结点都存有它双亲的位置。

  这样的存储结构,我们可以根据结点的parent指针很容易找到它的双亲结点,所用的时间复杂度为O(1),直到parent为**-1**时,表示找到了树结点的根。

2.2 孩子表示法

  换一种完全不同的考虑方法。由于树中每个结点可能有多棵子树,可以考虑用多重链表,即每个结点有多个指针域,其中每个指针指向一棵子树的根结点,我们把这种方法叫做多重链表表示法
  不过,树的每个结点的度,也就是它的孩子个数是不同的。所以可以设计两种方案来解决。
  方法一:
  一种是指针域的个数就等于树的度,前面讲过,树的度是树各个结点度的最大值
在这里插入图片描述
  其中data是数据域Child1到childd是指针域,用来指向该结点的孩子结点
  例:树的度是3,所以我们的指针域的个数是3

【数据结构与算法】——第五章:树与二叉树(1)_第9张图片
【数据结构与算法】——第五章:树与二叉树(1)_第10张图片
  这种方法对于树中各结点的度相差很大时,显然是很浪费空间的,因为有很多的结点,它的指针域都是空的。不过如果树的各结点度相差很小时,那就意味着开辟的空间被充分利用了,这时存储结构的缺点反而变成了优点。

  既然很多指针域都可能为空,为什么不按需分配空间呢。于是我们有了第二种方案。
  方法二:
  每个结点指针域的个数等于该结点的度,我们专门取一个位置来存储 结点指针域的个数。
【数据结构与算法】——第五章:树与二叉树(1)_第11张图片
  这种方法克服了浪费空间的缺点,对空间利用率是很高了,但是由于各个结点的链表是不相同的结构,加上要维护结点的度的数值,在运算上就会带来时间上的损耗。

  能否有更好的方法,既可以减少空指针的浪费又能使结点结构相同。
  仔细观察,我们为了要遍历整棵树,把每个结点放到一个顺序存储结构的数组中是合理的,但每个结点的孩子有多少是不确定的,所以我们再对每个结点的孩子建立一个单链表体现它们的关系。  

  这就是我们要讲的孩子表示法。具体办法是,把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。
【数据结构与算法】——第五章:树与二叉树(1)_第12张图片
  其中,设计两种结点结构:
  一个是孩子链表的孩子结点
在这里插入图片描述
  其中child是数据域,用来存储某个结点在表头数组中的下标。next是指针域,用来存储指向某结点的下一个孩子结点的指针。
  另一个是表头数组的表头结点
在这里插入图片描述
  其中data是数据域,存储某结点的数据信息。firstchild是头指针域,存储该结点的孩子链表的头指针。
  这样的结构对于我们要查找某个结点的某个孩子,或者找某个结点的兄弟,只需要查找这个结点的孩子单链表即可。
  但是,这也存在着问题,我们如何知道某个结点的双亲是谁呢?比较麻烦,需要整棵树遍历才行,难道就不可以把双亲表示法和孩子表示法综合一下吗?当然是可以。
【数据结构与算法】——第五章:树与二叉树(1)_第13张图片

2.3 孩子兄弟表示法

  刚才我们分别从双亲的角度和从孩子的角度研究树的存储结构,如果我们从树结点的兄弟的角度又会如何呢? 当然,对于树这样的层级结构来说,只研究结点的兄弟是不行的,我们观察后发现,任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
在这里插入图片描述
  其中data是数据域firstchild为指针域,存储该结点的第一个孩子结点的存储地址,rightsib是指针域,存储该结点的右兄弟结点的存储地址。
【数据结构与算法】——第五章:树与二叉树(1)_第14张图片

你可能感兴趣的:(数据结构,数据结构,算法,c++)