目录
1、树的定义
2、树的抽象数据类型
3、树的存储结构
总结
树(Tree)是n(n≥0)个结点的有限集。n=0时称为空树。
在任意一棵非空树种:
(1)有且仅有一个特定的称为根(Root)的结点;
(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、......、Tm,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree),如下图所示
强调两点:
1.n>0时根节点是唯一的,不可能存在多个根节点
2.m>0时,子树的个数没有限制,但是它们一定互不相交。例如下图都不属于树,因为存在相交的子树
度:
结点拥有的子树数称为结点的度
叶结点(终端结点):
度为0的结点称为叶结点(Leaf)或者终端结点
分支结点(非终端结点):
度不为0的结点称为分支结点或者非终端结点
(除根结点之外,分支结点也称为内部结点)
树的度:
树内各结点的度的最大值
孩子 双亲:
结点的子树的根称为该结点的孩子(Child)
相应地,该结点称为孩子的双亲
兄弟:
同一双亲的孩子之间互称兄弟(Sibling)
祖先 子孙:
结点的祖先是从根到该结点所经分支上的所有结点
反之,以某结点为根的子树中的任一结点都称为该结点的子孙(下图中B的子孙有DGHI)
堂兄弟:
双亲在同一层的结点互为堂兄弟,如D、E、F互为堂兄弟
树的深度(Depth)或者高度:
树中结点的最大层次称为树的深度(Depth)或者高度,上图树的深度为4
有序树 无序树:
如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则为无序树
森林:
m(m≥0)棵互不相交的树的集合
对树中每个结点而言,其子树的集合即为森林
线性表与树结构的差异:
ADT 树(Tree)
Data
树是由一个根结点和若干棵子树构成。树中结点具有相同的数据类型及层次关系。
Operation
InitTree(*T): 构造空树T。
DestroyTree(*T): 销毁树T。
CreateTree(*T, definition): 按definition中给出树的定义来构造树。
ClearTree(*T): 若树T存在,则将树T清为空树。
TreeEmpty(T): 若T为空树,返回true,否则返回false。
TreeDepth(T): 返回T的深度。
Root(T): 返回T的根结点。
Value(T, cur_e): cur_e是树T中一个结点,返回此结点的值。
Assign(T, cur_e, value): 给树T的结点cur_e赋值给value。
Parent(T, cur_e): 若cur_e是树T的非根结点,则返回它的双亲,否则返回空。
LeftChild(T, cur_e): 若cur_e是树T的非叶结点,则返回它的最左孩子,否则返回空。
RightSibling(T, cur_e): 若cur_e有右兄弟,则返回它的右兄弟,否则返回空。
InsertChild(*T, *p, i, c): 其中p指向树T的某个结点,i为所指结点p的度加上1,非空树c与T不相交,操作结果为插入c为树T中p所指结点的第i棵子树。
DeleteChild(*T, *p, i): 其中p指向树T的某个结点,i为所指结点p的度,操作结果为删除T中p所指结点的第i棵子树。
endADT
双亲表示法:
除了根结点外,其余每个结点不一定有孩子,但一定有且仅有一个双亲
用一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点在数组中的位置
结点结构如下:
(其中data是数据域,存储结点的数据信息;parent是指针域,存储该结点的双亲在数组中的下标)
(由于根结点没有双亲,我们可以将根结点的位置域设置为-1)
data | parent |
结点结构定义代码:
//树的双亲表示法结点结构定义
#define MAX_TREE_SIZE 100
typedef int TElemType;//树结点的数据类型,目前暂定为整型
typedef struct PTNode{//结点结构
TElemType data;//结点数据
int parent;//双亲位置
}PTNode;
typedef struct{//树结构
PTNode nodes[MAX_TREE_SIZE];//结点数组
int r, n;//跟的位置和结点数
}PTree;
改进:
如果需要访问结点的孩子,则需要遍历整个结构,不如增加一个最左边孩子的域,即长子域
(如果结点没有孩子,则将其长子域设置为-1)
data | parent | firstchild |
如果需要关注兄弟间的关系,可以增加一个右兄弟域来体现兄弟关系
(如果右兄弟不存在,则赋值为-1)
data | parent | rightsib |
孩子表示法——前言:
由于树中每个结点可能有多棵子树,可以考虑用多重链表,即每个结点有多个指针域,其中每个指针指向一棵子树的根结点,这种方法叫做多重链表表示法。
方案一:
指针域的个数等于树的度,即树各个结点度的最大值。
data | child1 | child2 | child3 | ...... | childd |
其中data是数据域。child1到childd是指针域,用来指向该结点的孩子结点。
这种方法的实现如下图:
这种方法对于树中各结点的度相差很大时,很浪费空间,因为有很多指针域都是空的
方案二:
每个结点指针域的个数等于该结点的度,取一个位置来存储结点指针域的个数。
data | degree | child1 | child2 | ...... | childd |
其中data是数据域,degree为度域,也就是存储该结点的孩子结点个数。child1到childd是指针域,用来指向该结点的孩子结点。
这种方法的实现如下图:
改进:
这种方法克服了浪费空间的缺点,提高了空间的利用率,但是由于各个结点的链表是不相同的结构,加上要维护结点的度的数值,在运算上就会带来时间上的损耗。
仔细观察,为了要遍历整棵树,把每个结点放到一个顺序存储结构的数组中是合理的,但是每个结点的孩子个数是不确定的,所以再对每个结点的孩子建立一个单链表体现它们的关系。
孩子表示法——正文:
把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。
设计两种结点结构,一个是孩子链表的孩子结点,如下所示:
child | next |
其中child是数据域,用来存储某个结点在表头数组中的下标。next是指针域,用来存储指向某结点的下一个孩子的结点的指针。
另一个是表头数组的表头结点,如下所示
data | firstchild |
其中data是数据域,存储某结点的数据信息。firstchild是头指针域,存储该结点的孩子链表的头指针。
结构定义代码如下:
//树的孩子表示法结构定义
#define MAX_TREE_SIZE 100
typedef struct CTNode {//孩子结点
int child;
struct CTNode *next;
} *ChildPtr;
typedef struct {//表头结构
TElemType data;
ChildPtr firstchild;
} CTBox;
typedef struct {//树结构
CTBox nodes[MAX_TREE_SIZE];//结点数组
int r, n;//根的位置和结点数
}CTree;
改进:
如果要知道某个结点的双亲,那就需要将整棵树遍历一遍,比较繁琐。
改进一下结构:
这种方法称为双亲孩子表示法。
孩子兄弟表示法:
设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟(记忆方法:左孩子右兄弟)
结点结构如下所示:
data | firstchild | rightsib |
其中data是数据域,firstchild为指针域,存储该结点的第一个孩子结点的存储地址,rightsib是指针域,存储该结点的右兄弟结点的存储地址。
结构定义代码如下:
//树的孩子兄弟表示法结构定义
typedef struct CTNode {
TElemType data;
struct CSNode *firstchild, *rightsib;
} CSNode, *CSTree;
这种方法实现的示意图如下:
这种表示法的最大好处是它把一棵复杂的树变成了一棵二叉树,变形上图后:
终于快到重点了,以上是第六章总结的上部分,中下部分主要以二叉树为主。
考完数据结构后,就没怎么更新了,因为在复习其它科目。
现在回家了,家里有一大堆事,所以关于树的总结延迟了很多天。
树的内容挺多的,一开始打算全部写完,最终还是决定分而治之,把总结分成两部分,这样效率比较高。
说实在的,其实这样写总结,就类似抄书,本人不是很喜欢这种做法,所以从下一篇文章开始,就不再延用这种写法了。
有时候会迷茫,会放弃,但是冷静一下,想想自己到底要的是什么,就继续坚持下去了,加油!