本章的主要内容是
Ø 树的逻辑结构
Ø 树的存储结构
Ø 二叉树的逻辑结构
Ø 二叉树的存储结构及实现
Ø 二叉树遍历的非递归算法
Ø 树、森林与二叉树的转换
5.1 树的逻辑结构
一、树的定义
1、树:n(n≥0)个结点的有限集合。当n=0时,称为空树;任意一棵非空树满足以下条件:
⑴ 有且仅有一个特定的称为根的结点;
⑵ 当n>1时,除根结点之外的其余结点被分成m(m>0)个互不相交的有限集合T1,T2,… ,Tm,其中每个集合又是一棵树,并称为这个根结点的子树。
二、树的基本术语
1、结点的度:结点所拥有的子树的个数。
2、树的度:树中各结点度的最大值。
3、叶子结点:度为0的结点,也称为终端结点。
4、 分支结点:度不为0的结点,也称为非终端结点。
5、 孩子、双亲:树中某结点子树的根结点称为这个结点的孩子结点,这个结点称为它孩子结点的双亲结点;
6、 兄弟:具有同一个双亲的孩子结点互称为兄弟。
7、 路径:如果树的结点序列n1, n2, …, nk有如下关系:结点ni是ni+1的双亲(1<=i<k),则把n1,n2, …, nk称为一条由n1至nk的路径;
8、 路径上经过的边的个数称为路径长度。
9、 祖先、子孙:在树中,如果有一条路径从结点x到结点y,则x称为y的祖先,而y称为x的子孙。
10、 结点所在层数:根结点的层数为1;对其余任何结点,若某结点在第k层,则其孩子结点在第k+1层。
11、 树的深度:树中所有结点的最大层数,也称高度。
12、 层序编号:将树中结点按照从上层到下层、同层从左到右的次序依次给他们编以从1开始的连续自然数。
13、 有序树、无序树:如果一棵树中结点的各子树从左到右是有次序的,称这棵树为有序树;反之,称为无序树。
14、 森林:m(m≥0)棵互不相交的树的集合。
三、树结构和线性结构的比较
线性结构 树结构
第一个数据元素 根结点(只有一个)
无前驱 无双亲
最后一个数据元素 叶子结点(可以有多个)
无后继 无孩子
其它数据元素 其它结点
一个前驱,一个后继 一个双亲,多个孩子
一对一 一对多
四、树的抽象数据类型定义
(一)树的抽象数据类型定义
ADT Tree
Data
树是由一个根结点和若干棵子树构成,
树中结点具有相同数据类型及层次关系
Operation
InitTree
前置条件:树不存在
输入:无
功能:初始化一棵树
输出:无
后置条件:构造一个空树
DestroyTree
前置条件:树已存在
输入:无
功能:销毁一棵树
输出:无
后置条件:释放该树占用的存储空间
PreOrder
前置条件:树已存在
输入:无
功能:前序遍历树
输出:树的前序遍历序列
后置条件:树保持不变
PostOrder
前置条件:树已存在
输入:无
功能:后序遍历树
输出:树的后序遍历序列
后置条件:树保持不变
endADT
(二)树的遍历操作
1、树的遍历:从根结点出发,按照某种次序访问树中所有结点,使得每个结点被访问一次且仅被访问一次。
(1)如何理解访问?
抽象操作,可以是对结点进行的各种处理,这里简化为输出结点的数据。
(2)遍历的实质?
树结构(非线性结构)→线性结构。
(3)如何理解次序?
树通常有前序(根)遍历、后序(根)遍历和层序(次)遍历三种方式。
(三)前序遍历
树的前序遍历操作定义为:
若树为空,则空操作返回;否则
⑴访问根结点;
⑵按照从左到右的顺序前序遍历根结点的每一棵子树。
(四)后序遍历
树的后序遍历操作定义为:
若树为空,则空操作返回;否则
⑴按照从左到右的顺序后序遍历根结点的每一棵子树;
⑵访问根结点。
(五)层序遍历
树的层序遍历操作定义为:
从树的第一层(即根结点)开始,自上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。
5.2 树的存储结构
1、实现树的存储结构,关键是什么?
如何表示树中结点之间的逻辑关系。
2、什么是存储结构?
数据元素以及数据元素之间的逻辑关系在存储器中的表示。
3、树中结点之间的逻辑关系是什么?
思考问题的出发点:如何表示结点的双亲和孩子
一、双亲表示法
1、基本思想:用一维数组来存储树的各个结点(一般按层序存储),数组中的一个元素对应树中的一个结点,包括结点的数据信息以及该结点的双亲在数组中的下标。
data:存储树中结点的数据信息
parent:存储该结点的双亲在数组中的下标
2、
template
struct PNode
{
DataType data; //数据域
int parent; //指针域,双亲在数组中的下标
} ;
二、孩子链表表示法
1、孩子的表示:
链表中的每个结点包括一个数据域和多个指针域,每个指针域指向该结点的一个孩子结点。
方案一:指针域的个数等于树的度
方案二:指针域的个数等于该结点的度
2、孩子链表的基本思想:
把每个结点的孩子排列起来,看成是一个线性表,且以单链表存储,则n个结点共有 n 个孩子链表。这 n 个单链表共有 n 个头指针,这 n 个头指针又组成了一个线性表,为了便于进行查找采用顺序存储。最后,将存放n 个头指针的数组和存放n个结点的数组结合起来,构成孩子链表的表头数组。
3、孩子结点
struct CTNode
{
int child;
CTNode *next;
};
4、表头结点
template
struct CBNode
{
DataType data;
CTNode *firstchild;
};
5.3 二叉树的逻辑结构
一、二叉树的定义
二叉树是n(n≥0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
二、二叉树的特点
⑴每个结点最多有两棵子树;
⑵二叉树是有序的,其次序不能任意颠倒。
三、特殊的二叉树
(一)斜树
1、定义:
(1)所有结点都只有左子树的二叉树称为左斜树;
(2)所有结点都只有右子树的二叉树称为右斜树;
(3)左斜树和右斜树统称为斜树。
2、斜树的特点:
(1)在斜树中,每一层只有一个结点;
(2)斜树的结点个数与其深度相同。
(二)满二叉树
1、定义:
在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上。
2、满二叉树的特点:
(1)叶子只能出现在最下一层;
(2)只有度为0和度为2的结点。
3、
满二叉树在同样深度的二叉树中结点个数最多
满二叉树在同样深度的二叉树中叶子结点个数最多
(三)完全二叉树
1、定义:
对一棵具有n个结点的二叉树按层序编号,如果编号为i(1≤i≤n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中的位置完全相同。
2、在满二叉树中,从最后一个结点开始,连续去掉任意个结点,即是一棵完全二叉树。
3、完全二叉树的特点
(1)叶子结点只能出现在最下两层且最下层的叶子结点都集中在二叉树的左面;
(2)完全二叉树中如果有度为1的结点,只可能有一个,且该结点只有左孩子。
(3) 深度为k的完全二叉树在k-1层上一定是满二叉树。
(4)在同样结点个数的二叉树中,完全二叉树的深度最小。
四、二叉树的基本性质
1、性质5-1 二叉树的第i层上最多有2i-1个结点(i≥1)。
2、性质5-2 一棵深度为k的二叉树中,最多有2k-1个结点,最少有k个结点。
注意:
深度为k且具有2k-1个结点的二叉树一定是满二叉树,
深度为k且具有k个结点的二叉树不一定是斜树。
3、性质5-3 在一棵二叉树中,如果叶子结点数为n0,度为2的结点数为n2,则有: n0=n2+1。
4、性质5-4 具有n个结点的完全二叉树的深度为 log2n +1。
5、性质5-5 对一棵具有n个结点的完全二叉树中从1开始按层序编号,则对于任意的序号为i(1≤i≤n)的结点(简称为结点i),有:
(1)如果i>1,则结点i的双亲结点的序号为 i/2;如果i=1,则结点i是根结点,无双亲结点。
(2)如果2i≤n,则结点i的左孩子的序号为2i;
如果2i>n,则结点i无左孩子。
(3)如果2i+1≤n,则结点i的右孩子的序号为2i+1;如果2i+1>n,则结点 i无右孩子。
结论:
对一棵具有n个结点的完全二叉树中从1开始按层序编号,则
l 结点i的双亲结点为 i/2;
l 结点i的左孩子为2i;
l 结点i的右孩子为2i+1。
五、二叉树的抽象数据类型定义
(一)二叉树的抽象数据类型定义
ADT BiTree
Data
由一个根结点和两棵互不相交的左右子树构成,
结点具有相同数据类型及层次关系
Operation
InitBiTree
前置条件:无
输入:无
功能:初始化一棵二叉树
输出:无
后置条件:构造一个空的二叉树
DestroyBiTree
前置条件:二叉树已存在
输入:无
功能:销毁一棵二叉树
输出:无
后置条件:释放二叉树占用的存储空间
PreOrder
前置条件:二叉树已存在
输入:无
功能:前序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
InOrder
前置条件:二叉树已存在
输入:无
功能:中序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
PostOrder
前置条件:二叉树已存在
输入:无
功能:后序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
LeverOrder
前置条件:二叉树已存在
输入:无
功能:层序遍历二叉树
输出:二叉树中结点的一个线性排列
后置条件:二叉树不变
endADT
(二)二叉树的遍历操作
二叉树的遍历是指从根结点出发,按照某种次序访问二叉树中的所有结点,使得每个结点被访问一次且仅被访问一次。
1、根结点;
②前序遍历根结点的左子树;
③前序遍历根结点的右子树。
2、中序(根)遍历
若二叉树为空,则空操作返回;否则:
①中序遍历根结点的左子树;
②访问根结点;
③中序遍历根结点的右子树。
3、后序(根)遍历
若二叉树为空,则空操作返回;否则:
①后序遍历根结点的左子树;
②后序遍历根结点的右子树。
③访问根结点;
4、层序遍历
二叉树的层次遍历是指从二叉树的第一层(即根结点)开始,从上至下逐层遍历,在同一层中,则按从左到右的顺序对结点逐个访问。
5.4 二叉树的存储结构及实现
一、顺序存储结构
二叉树的顺序存储结构就是用一维数组存储二叉树中的结点,并且结点的存储位置(下标)应能体现结点之间的逻辑关系——父子关系。
二、二叉链表
1、基本思想:
令二叉树的每个结点对应一个链表结点,链表结点除了存放与二叉树结点有关的数据信息外,还要设置指示左右孩子的指针。
2、
template
struct BiNode
{
DataType data;
BiNode
};
3、二叉树的存储结构及实现
template
class BiTree
{
public:
BiTree(){root = Creat(root);} //构造函数,建立一棵二叉树
~BiTree( ){Release(root);} //析构函数
void PreOrder( ){PreOrder(root);} //前序遍历二叉树
void InOrder( ){InOrder(root);} //中序遍历二叉树
void PostOrder( ){PostOrder(root);} //后序遍历二叉树
void LeverOrder( ); //层序遍历二叉树
private:
BiNode
BiNode
void Release(BiNode
void PreOrder(BiNode
void InOrder(BiNode
void PostOrder(BiNode
};
4、前序遍历——递归算法
template
voidBiTree
{
if (bt == NULL) return; //递归调用的结束条件
else {
cout << bt->data; //访问根结点bt的数据域
PreOrder(bt->lchild); //前序递归遍历bt的左子树
PreOrder(bt->rchild); //前序递归遍历bt的右子树
}
}
5、中序遍历——递归算法
template
voidBiTree
{
if (bt == NULL) return; //递归调用的结束条件
else {
InOrder(bt->lchild); //中序递归遍历bt的左子树
cout << bt->data; //访问根结点bt的数据域
InOrder(bt->rchild); //中序递归遍历bt的右子树
}
}
6、后序遍历——递归算法
template
voidBiTree
{
if (bt == NULL) return; //递归调用的结束条件
else {
PostOrder(bt->lchild); //后序递归遍历bt的左子树
PostOrder(bt->rchild); //后序递归遍历bt的右子树
cout << bt->data; //访问根结点bt的数据域
}
}
7、层序遍历
2. 如果二叉树非空,将根指针入队;
3. 循环直到队列Q为空
3.1 q=队列Q的队头元素出队;
3.2 访问结点q的数据域;
3.3 若结点q存在左孩子,则将左孩子指针入队;
3.4 若结点q存在右孩子,则将右孩子指针入队;
template
voidBiTree
{
front = rear = -1; //采用顺序队列,并假定不会发生上溢
if (root == NULL) return; //二叉树为空,算法结束
Q[++rear] = root; //根指针入队
while (front != rear) //当队列非空时
{
q = Q[++front]; //出队
cout << q->data;
if (q->lchild != NULL) Q[++rear] = q->lchild;
if (q->rchild != NULL) Q[++rear] = q->rchild;
}
}
8、构造函数——建立二叉树
template
BiTree ::BiTree( )
{
root = Creat(root);
}
template
BiNode
{
cin >> ch; //输入结点的数据信息,假设为字符
if (ch == '# ') bt = NULL; //建立一棵空树
else {
bt = new BiNode; bt->data = ch; //生成一个结点,数据域为ch
bt->lchild =Creat(bt->lchild); //递归建立左子树
bt->rchild =Creat(bt->rchild); //递归建立右子树
}
return bt;
}
三、三叉链表
(一)定义:
1、线索:将二叉链表中的空指针域指向前驱结点和后继结点的指针被称为线索;
2、线索化:使二叉链表中结点的空链域存放其前驱或后继信息的过程称为线索化;
3、线索链表:加上线索的二叉链表称为线索链表。
(二)结点结构
1、
enum flag{Child, Thread};
template
structThrNode
{
DataType data;
ThrNode
flag ltag, rtag;
};
(三)线索二叉树
1、二叉树的遍历方式有4种,故有4种意义下的前驱和后继,相应的有4种线索二叉树:
⑴前序线索二叉树
⑵中序线索二叉树
⑶后序线索二叉树
⑷层序线索二叉树
2、中序线索链表类的声明
template
classInThrBiTree
{
public:
InThrBiTree( ); //构造函数,建立中序线索链表
~ InThrBiTree( ); //析构函数,释放各结点的存储空间
ThrNode *Next(ThrNode
void InOrder( ); //中序遍历线索链表
private:
ThrNode *root; //指向线索链表的头指针
ThrNode
void ThrBiTree(ThrNode
ThrNode
};
3、中序线索链表的建立——构造函数
(1) 建立二叉链表,将每个结点的左右标志置为0;
(2)遍历二叉链表,建立线索;
2.1 如果二叉链表root为空,则空操作返回;
2.2 对root的左子树建立线索;
2.3 对根结点root建立线索;
2.3.1若root没有左孩子,则为root加上前驱线索;
2.3.2若root没有右孩子,则将root右标志置为1;
2.3.3若结点pre右标志为1,则为pre加上后继线索;
2.3.4令pre指向刚刚访问的结点root;
2.4 对root的右子树建立线索。
(3)
template
voidInThrBiTree
ThrNode
{
if (bt == NULL) return;
ThrBiTree(bt->lchild, pre);
if (bt->lchild == NULL) { //对bt的左指针进行处理
bt->ltag = 1;
bt->lchild = pre; //设置pre的前驱线索
}
if (bt->rchild == NULL) bt->rtag =1; //对bt的右指针进行处理
if (pre->rtag == 1) pre->rchild =bt; //设置pre的后继线索
pre = bt;
ThrBiTree(bt->rchild, pre);
}
4.中序线索链表查找后继
template
ThrNode
ThrNode
{
if (p->rtag == 1)
q = p->rchild; //右标志为1,可直接得到后继结点
else {
q = p->rchild; //工作指针q指向结点p的右孩子
while (q->ltag == 0) //查找最左下结点
q = q->lchild;
}
return q;
}
5.5 二叉树遍历的非递归算法
一、前序遍历——非递归算法
1、二叉树前序遍历的非递归算法的关键:在前序遍历过某结点的整个左子树后,如何找到该结点的右子树的根指针。
解决办法:在访问完该结点后,将该结点的指针保存在栈中,以便以后能通过它找到该结点的右子树。
2、在前序遍历中,设要遍历二叉树的根指针为root,则有两种可能:
⑴若root!=NULL,则表明?如何处理?
⑵若root=NULL,则表明?如何处理?
3、前序遍历——非递归算法(伪代码)
1.栈s初始化;
2.循环直到root(p)为空且栈s为空
2.1 当root(p)不空时循环
2.1.1 输出root(p)->data;
2.1.2 将指针root(p)的值保存到栈中;
2.1.3 继续遍历root(p)的左子树
2.2 如果栈s不空,则
2.2.1 将栈顶元素弹出至root(p);
2.2.2 准备遍历root(p)的右子树;
template
voidBiTree::PreOrder(BiNode
{
top = -1; //采用顺序栈,并假定不会发生上溢
while (root != NULL || top != -1)
{
while (root != NULL)
{
cout<
s[++top] = root;
root = root->lchild;
}
if (top != -1) {
root = s[top--];
root = root->rchild;
}
}
}
二、中序遍历——非递归算法
template
voidBiTree::PreOrder(BiNode
{
top = -1; //采用顺序栈,并假定不会发生上溢
while (root != NULL || top != -1)
{
while (root != NULL)
{
s[++top] = root;
root = root->lchild;
}
if (top != -1) {
root = s[top--];
cout<
root = root->rchild;
}
}
}
三、后序遍历——非递归算法
template
voidBiTree
{
top = -1; //采用顺序栈,并假定栈不会发生上溢
while (bt != NULL || top != -1) //两个条件都不成立才退出循环
{
while (bt != NULL)
{
top++; s[top].ptr = bt; s[top].flag =1; //root连同标志flag入栈
bt = bt->lchild;
}
while (top != -1 &&s[top].flag == 2)
{
bt = s[top--].ptr; cout <
}
if (top != -1) {
s[top].flag = 2; bt =s[top].ptr->rchild;
}
}
}
5.6 树、森林与二叉树的转换
一、树转换为二叉树
⑴加线——树中所有相邻兄弟之间加一条连线。
⑵去线——对树中的每个结点,只保留它与第一个孩子结点之间的连线,删去它与其它孩子结点之间的连线。
⑶层次调整——以根结点为轴心,将树顺时针转动一定的角度,使之层次分明。
二、森林转换为二叉树
⑴将森林中的每棵树转换成二叉树;
⑵从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子,当所有二叉树连起来后,此时所得到的二叉树就是由森林转换得到的二叉树。
三、二叉树转换为树或森林
⑴加线——若某结点x是其双亲y的左孩子,则把结点x的右孩子、右孩子的右孩子、……,都与结点y用线连起来;
⑵去线——删去原二叉树中所有的双亲结点与右孩子结点的连线;
⑶层次调整——整理由⑴、⑵两步所得到的树或森林,使之层次分明。
四、森林的遍历
森林有两种遍历方法:
⑴前序(根)遍历:前序遍历森林即为前序遍历森林中的每一棵树。
⑵后序(根)遍历:后序遍历森林即为后序遍历森林中的每一棵树。
5.7 哈夫曼树及哈夫曼编码
一、相关概念
1、叶子结点的权值:对叶子结点赋予的一个有意义的数值量。
2、二叉树的带权路径长度:设二叉树具有n个带权值的叶子结点,从根结点到各个叶子结点的路径长度与相应叶子结点权值的乘积之和。
二、哈夫曼树
1、定义:
给定一组具有确定权值的叶子结点,带权路径长度最小的二叉树。
2、哈夫曼树的特点:
(1)权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。
(2)只有度为0(叶子结点)和度为2(分支结点)的结点,不存在度为1的结点.
3、哈夫曼算法基本思想:
⑴初始化:由给定的n个权值{w1,w2,…,wn}构造n棵只有一个根结点的二叉树,从而得到一个二叉树集合F={T1,T2,…,Tn};
⑵选取与合并:在F中选取根结点的权值最小的两棵二叉树分别作为左、右子树构造一棵新的二叉树,这棵新二叉树的根结点的权值为其左、右子树根结点的权值之和;
⑶删除与加入:在F中删除作为左、右子树的两棵二叉树,并将新建立的二叉树加入到F中;
⑷重复⑵、⑶两步,当集合F中只剩下一棵二叉树时,这棵二叉树便是哈夫曼树。
4、伪代码
(1)数组huffTree初始化,所有元素结点的双亲、左
右孩子都置为-1;
(2)数组huffTree的前n个元素的权值置给定值w[n];
(3) 进行n-1次合并
3.1 在二叉树集合中选取两个权值最小的根结点,
其下标分别为i1, i2;
3.2 将二叉树i1、i2合并为一棵新的二叉树k;
voidHuffmanTree(element huffTree[ ], int w[ ], int n ) {
for (i = 0; i <2*n-1; i++) {
huffTree [i].parent = -1;
huffTree [i].lchild = -1;
huffTree [i].rchild = -1;
}
for (i = 0; i < n; i++)
huffTree[i].weight = w[i];
for (k = n; k < 2*n-1; k++) {
Select(huffTree,i1, i2);
huffTree[k].weight =huffTree[i1].weight+huffTree[i2].weight;
huffTree[i1].parent = k;huffTree[i2].parent = k;
huffTree[k].lchild = i1;huffTree[k].rchild = i2;
}
}