度:结点拥有的子树数称为该结点的度,结点B的结点为2
分支结点(非终端结点): 度不为0的结点
叶子(终端结点):度为0的结点
树的度:树内各结点的度的最大值,上图中D结点的度最大为3,所以这个树的度为3
孩子:结点的子树的根,该结点称为孩子的双亲
兄弟:同一个双亲的孩子之间互称兄弟
祖先:从根到该节点所经分支的所有结点
子孙:以某结点为根的子树中任一结点都是该结点的子孙
堂兄弟:双亲在同一层的结点互为堂兄弟
结点的层次:从跟开始定义,根为第一层,根的孩子为第二层
若某结点在第n层,其子树的根就在(n+1)层
树的深度(高度):树中结点的最大层次
结点的深度,高度,和层次
路径和路径长度:
森林:m(m>=0)棵互不相交的树的集合
性质 1 :在二叉树的第 i 层上至多有2i-1 个结点(i ≥ 1)。
性质 2 :深度为 k 的二叉树上至多含 2k-1 个结点(k≥1)。
性质 3 :对任何一棵二叉树,若它含有n0 个叶子结点、n2 个度为 2 的结点,则必存在关系式:n0 = n2+1。
两类特殊的二叉树:
满二叉树:指的是深度为k且含有2k-1个结点的二叉树。(左图)
完全二叉树:树中所含的 n 个结点和满二叉树中编号为 1 至 n 的结点一一对应。(右图)
上面啰嗦了这么多,下面开始进入正题啦,下面介绍二叉树的几种存储结构
#define MAX_TREE_SIZE 100
typedef TElemType SqBiTREE[MAX_TREE_SIZE];
SqBiTree bt;
顺序存储结构仅适用于完全二叉树
typedef struct BiTNode { // 结点结构
TElemType data;
struct BiTNode *lchild, *rchild;// 左右孩子指针
} BiTNode, *BiTree;
# include
# include
#define TElemType int
/*二叉树的结点结构*/
typedef struct BiTNode{
TElemType data;
struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
/*创建二叉树*/
BiTree CreateBiTree(){
BiTree T;
/*分配存储空间*/
T = (BiTNode *)malloc(sizeof(BiTNode));
T->lchild = (BiTNode *)malloc(sizeof(BiTNode));
T->rchild = (BiTNode *)malloc(sizeof(BiTNode));
T->lchild->lchild= (BiTNode*)malloc(sizeof(BiTNode));
/*赋值*/
T->data = 1;
T->lchild->data = 2;
T->rchild->data = 3;
T->lchild->lchild->data = 4;
/*让结点的指针域为空*/
T->lchild->lchild->lchild = NULL;
T->lchild->lchild->rchild = NULL;
T->lchild->rchild = NULL;
T->rchild->lchild = NULL;
T->rchild->rchild = NULL;
return T;
}
int main(){
/*创建二叉树*/
BiTree Tree = CreateBiTree();
printf("%d",Tree->lchild->lchild->data);
return 0;
}
但是实际应用中,不可能在创建的时候手动给二叉树赋值,一般都是动态加入的。
代码如下:
#include
#include
#define OVERFLOW -2
typedef char TElemType;
/*二叉树的结点结构*/
typedef struct BiTNode{
TElemType data;
struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
/*创建二叉树*/
BiTree CreateBiTree(BiTree T){
/*分配存储空间*/
T = (BiTNode *)malloc(sizeof(BiTNode));
char ch;
scanf("%c",&ch);
//如果输入为空,则二叉树是空树
if(ch=='#'){
T = NULL;
}else{
if(!T){
printf("分配存储空间失败!");
exit(OVERFLOW);
}
T->data = ch;//先输入根结点
T->lchild = CreateBiTree(T->lchild);//递归生成左子树
T->rchild = CreateBiTree(T->rchild);//递归生成右子树
}
return T;
}
int main(){
/*创建二叉树*/
BiTree T;
printf("请输入二叉树中的元素 # 表示空\n");
BiTree Tree = CreateBiTree(T);
return 0;
}
需要注意的是递归创建左右子树的时的代码:
T->lchild = CreateBiTree(T->lchild);//递归生成左子树
T->rchild = CreateBiTree(T->rchild);//递归生成右子树
输入:124##5##3##
二叉树就创建成功了,遍历二叉树会在后面介绍到
创建的二叉树为:
(2).三叉链表
由二叉链表的结点结构可知,想要找到结点的双亲是比较困难的,为了找到结点的双亲,可以在结点结构中增加一个指向双亲的指针域。如下所示
由这种结点结构所构成的二叉树的存储结构分别称为三叉链表。
typedef struct TriTNode { // 结点结构
TElemType data;
struct TriTNode *lchild, *rchild;// 左右孩子指针
struct TriTNode *parent; //双亲指针
} TriTNode, *TriTree;
typedef struct BPTNode { // 结点结构
TElemType data;
int *parent; // 指向双亲的指针
char LRTag; // 左、右孩子标志域
} BPTNode
typedef struct BPTree{ // 树结构
BPTNode nodes[MAX_TREE_SIZE];
int num_node; // 结点数目
int root; // 根结点的位置
} BPTree
(4).线索链表
使用二叉链表创建二叉树:
BiTree CreateBiTree(BiTNode *T)
{
char c;
scanf("%c",&c);
if(c==' '){
T=NULL;
} else{
T=(BiTNode *)malloc(sizeof(BiTNode));
T->data=c;
T->lchild=CreateBiTree(T->lchild);
T->rchild=CreateBiTree(T->rchild);
}
return T;
}
当以二叉链表作为存储结构时,无法直接得到在任一序列中结点的前驱和后继信息,这种信息只有在遍历的动态过程中才能得到。
如何保存这种在遍历过程中得到的信息呢?
可以做如下规定:
若结点有左子树,则其lchild域 指示其左孩子,否则令 lchild域 指示其前驱;
若结点有右孩子,则其rchild域 指示其右孩子,否则令 rchild域 指示其后继。
为避免混淆,在结点结构上增加两个标志域
LTag=
RTag=
注意: a 才是根节点,根节点是模仿线性表的存储结构,在二叉树的线索链表上也添加一个头节点,并令其lchild 域的指针指向二叉树的根节点,其rchild 域的指针指向中序遍历时访问的最后一个结点,
并使中序遍历序列中第一个结点的lchild 域指针,和最后一个结点的rchild域指针均指向头节点。
好比为二叉树建立了一个双向线索链表,既可从第一个结点起顺后继进行遍历,也可以从最后一个结点起顺前驱进行遍历
可以看到,树中所有叶子节点的右链是线索,右链域直接指示了结点的后继。
但是树中非终端结点的右链均为指针,怎么能得到后继的信息呢?
在中序线索链表中:
根据中序遍历的规律可知,结点的后继应该是遍历其右子树时访问的第一个结点,即右子树最左下的结点,
如在找b 的后继时,先沿右指针找到其右子树的根节点 e ,然后顺着 e 的左指针往下找一直找到左标志为 1 的结点,即为 b 的后继(图中e下面只有一层,如果是多层,也是一直往左找),所以可以看到图中g 的前驱为 b ,
如何找结点的前驱呢?
若其左标志为1,则左链为线索,指示其前驱。如图中 g 的前驱是b,c的前驱是a
若其左标志为0,则遍历左子树时最后访问的一个结点(左子树的右下角)为其前驱
如上图中,a 的前驱是h,因为a左子树最后访问的结点是h。
遍历这个中序线索链表如下紫色线条
在后序线索树中找结点的后继
可分三种情况
二叉树的二叉线索存储表示:
typedef int TElemType;
typedef int PointerTag;
typedef enum PointerTag{ Link, Thread};// Link == 0: 指针,Thread == 1: 线索
/*结点的定义*/
typedef struct BiThrNode{
TElemType data; //数据域
BiThrNode *lchild, *rchild;//结点的左右孩子
PointerTag LTag,RTag; //标志域
}BiThrNode, *BiThrTree;
要获得线索二叉树,首先创建一个普通二叉链表树:
/*创建二叉树*/
BiThrTree CreateBiThrTree(BiThrTree BT){
BT = (BiThrNode *)malloc(sizeof(BiThrNode));//分配存储空间
if(!BT){
printf("分配存储空间失败\n");
}
TElemType ch;
scanf("%c",&ch);
if(ch =='#'){
BT = NULL;
}else{
BT->data = ch;
BT->lchild = CreateBiThrTree(BT->lchild);
BT->rchild = CreateBiThrTree(BT->rchild);
}
return BT;
}
然后再在遍历二叉树的时候将二叉树线索化,即将二叉链表中的控制很改为指向前驱或者后继的线索。
/*中序遍历进行线索化*/
void InThreading(BiThrTree T){
BiThrTree preT;
preT = (BiThrNode *)malloc(sizeof(BiThrNode));
if(T){
InThreading(T->lchild);//左子树线索化
/*根节点线索化*/
if(!T->lchild){//如果跟结点的左孩子为空
T->LTag = Thread;//结点的左标志为1,指向前驱
T->lchild = preT;//结点的左指针域指向前驱
}
if(!preT->rchild){//如果双亲结点没有右孩子
T->RTag = Thread;//结点的右标志为1,指向后继
preT->rchild = T;//结点的双亲结点的后继指向该结点
}
preT = T;//preT指向T 的前驱
InThreading(T->rchild);
}
}
/*将中序遍历二叉树并将其线索化*/
BiThrTree InOrderThreading(BiThrTree T){
BiThrTree preT;
preT = (BiThrNode *)malloc(sizeof(BiThrNode));
BiThrTree Thr;//指向头节点
if(!(Thr = (BiThrNode *)malloc(sizeof(BiThrNode)))) exit(-2);//分配存储空间
//建立头节点
Thr->LTag = Link;//左标志为0,指向左孩子
Thr->RTag = Thread;//右标志为1,指向后继
Thr->rchild = Thr;//右指针回指
if(!T) Thr->lchild = Thr;//若二叉树为空,左指针回指
else{
Thr->lchild = T;//头节点的左孩子是根节点
preT = Thr;
InThreading(T);//中序遍历进行中序线索化
preT->rchild = Thr;
preT->RTag = Thread;//最后一个结点线索化
Thr->rchild = preT;//
}
return T;
}
遍历是二叉树各种操作的基础,可以在遍历过程中对节点进行各种操作。
顺着某一条搜索路径巡防二叉树中的结点,使得每个结点均被访问一次,而且仅被访问一次。
如果是线性表之类的线性结构而言,遍历很简单,因为只有一条搜索路径。但是二叉树是非线性结构,每个结点有两个后继,则存在如何遍历即按照什么样的搜索路径遍历的问题。
二叉树由以下三个部分组成。根节点,左子树,右子树
由二叉树的这种结构,一般遍历时都是先遍历左子树,再遍历右子树。
所以有三种方法(这三种方法都是二叉树不为空的前提下进行的):
#include
#include
#define OVERFLOW -2
typedef char TElemType;
/*二叉树的结点结构*/
typedef struct BiTNode{
TElemType data;
struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
/*创建二叉树*/
BiTree CreateBiTree(BiTree T){
/*分配存储空间*/
T = (BiTNode *)malloc(sizeof(BiTNode));
char ch;
scanf("%c",&ch);
//如果输入为空,则二叉树是空树
if(ch=='#'){
T = NULL;
}else{
if(!T){
printf("分配存储空间失败!");
exit(OVERFLOW);
}
T->data = ch;//先输入根结点
T->lchild = CreateBiTree(T->lchild);//递归生成左子树
T->rchild = CreateBiTree(T->rchild);//递归生成右子树
}
return T;
}
void PrintElement(BiTree T){
printf("%c\n",T->data);
}
/*先序遍历二叉树*/
void PreOrderTraverse(BiTree T){
if(T){
PrintElement(T);//先访问根结点
PreOrderTraverse(T->lchild);//递归访问左子树
PreOrderTraverse(T->rchild);//递归访问右子树
}
return;//如果树为空,返回上一次
}
int main(){
/*创建二叉树*/
BiTree T;
printf("请输入二叉树中的元素 # 表示空\n");
BiTree Tree = CreateBiTree(T);
/*先序遍历二叉树*/
printf("二叉树为:\n");
PreOrderTraverse(Tree);
return 0;
}
原理和先序遍历一样:
......
void PrintElement(BiTree T){
printf("%c\n",T->data);
}
/*中序遍历二叉树*/
void LastOrderTraverse(BiTree T){
if(T){
LastOrderTraverse(T->lchild);//递归访问左子树
PrintElement(T);
LastOrderTraverse(T->rchild);//递归访问右子树
}
return;//如果树为空,返回上一次
}
......
void PrintElement(BiTree T){
printf("%c\n",T->data);
}
/*后序遍历二叉树*/
void PreOrderTraverse(BiTree T){
if(T){
PreOrderTraverse(T->lchild);//递归访问左子树
PreOrderTraverse(T->rchild);//递归访问右子树
PrintElement(T);
}
return;//如果树为空,返回上一次
}
按照二叉树中的层次从上到下,从左到右依次遍历每层中的结点
具体的实现思路是:
通过使用队列的数据结构,从树的根结点开始,依次将其左孩子和右孩子入队。而后每次队列中一个结点出队,都将其左孩子和右孩子入队,直到树中所有结点都出队,出队结点的先后顺序就是层次遍历的最终结果。
/*求二叉树深度*/
int TreeDepth(BiTree T){
int treedepth;//二叉树深度
int ldepth;//左子树深度
int rdepth;//右子树深度
if(!T){
treedepth = 0;
}else{
ldepth = TreeDepth(T->lchild);
rdepth = TreeDepth(T->rchild);
if(ldepth>rdepth){
treedepth = ldepth + 1;
}else{
treedepth = rdepth + 1;
}
}
return treedepth;
}
待添加
待添加
假设一组连续空间存储树的结点,同时在每一个结点中附设一个指示器指示其双亲结点在链表中的位置,
#define MAX_TREE_SIZE 100
//结点结构
typedef struct PTNode{
TElemType data;//数据域
int parent; //双亲位置域
}PTNode;
//树结构
typedef struct {
PTNode nodes[MAX_TREE_SIZE];
int r,n;//树的位置和节点数
}PTree;
这种存储结构利用了除了根节点外每个结点只有一个双亲的性质,PARENT(T,x)操作可以在常量时间内实现,反复调用PARENT 操作,直到遇见无双亲的结点时,便找到了树的根,这就是ROOT(x)操作的执行方法,但是在这种表示法中,求结点的孩子时需要遍历整个结构。
由于树中每个结点可能会有多课子树,则可以使用多重链表,即每个结点有多个指针域,其中每个指针指向一棵子树的根节点,此时链表中的结点可以有如下两种结点格式
采用上面这种结点格式,则多重链表中的结点是同构的,其中d 为树的度,由于树中很多结点的度小于d,所以链表中很多空链域,空间较浪费,在一颗有n 个结点的,度为k 的树中,必有n(k-1)+1 个空链域。
采用这种结点格式,多重链表中的结点是不同构的,其中d 为结点的度,degree 域的值同d,此时虽然节约存储空间,但是操作不方便。
还有一种方法是将每个结点的孩子结点排列起来,看成是一个线性表,且以单链表作为存储结构,n个结点有n个孩子链表,叶子的孩子链表为空表。而n个头指针又组成一个线性表,为了便于查找,可采用顺序存储结构,如下:
typedef struct CTNode{
int child;
struct CTNode *next;
}*ChildPtr;
typedef struct{
TElemType data;
ChildPtr firstchild;//孩子链表头指针
}CTBox;
typedef struct {
CTBox nodes[MAX_TREE_SIZE];
int n,r;//结点数和根的位置
}CTree;
由于二叉树和树都可以用二叉链表作为存储结构,则以二叉链表作为媒介可以导出树与二叉树之间的一个对应关系。
也就是说,给定一棵树,可以找到唯一的一颗二叉树与之对应,从物理结构来看,他们的二叉链表是相同的,只是解释不同而已
下面是一个树和二叉树的对应关系示例
树转换为二叉树的过程如下
从树的二叉链表表示的定义可知,任何一颗和树对应的二叉树,其右子树必定为空。
若把森林中第二棵树的根结点看成是第一棵树的根结点的兄弟,则同样可以到处森林和二叉树的对应关系。
一一对应的关系导致森林或树或二叉树可以相互转换,其形式定义如下;
方法一
如果F= {T1,T2,····,Tm}是森林,可按如下规则转换成一棵二叉树,B = (root, LB, RB)。
方法二
1.把每棵树转换为二叉树(参考上述方法)。
2.第一棵二叉树不动,从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树的根结点的右孩子,用线连接起来。当所有的二叉树连接起来后就得到了由森林转换来的二叉树。
方法一
如果B=(root,LB,RB) 是一颗二叉树,可按如下规则转换成森林
方法二
判断一棵二叉树能够转换成一棵树还是森林,标准很简单,只要看这棵树的根结点有没有右孩子,有的话就是森林,没有的话就是一棵树。
将二叉树转换为森林的步骤如下:
由树的结构可以引出两种次序遍历树的方法,
一种是先根(次序)遍历树:先访问根结点,再依次先根遍历根的每棵子树;
另一种是后根(次序)遍历树:先依次后根遍历每棵子树,然后访问根结点。
这里没有中根遍历树,因为二叉树的根结点只有左子树和右子树两棵树,而树的根结点可能有多棵树。
森林和树一样,也有两种遍历方法
先序遍历森林
若森林非空,可以按照下述规则遍历:
中序遍历森林
若森林非空,按照如下规则遍历
当森林转换成二叉树时,其第一颗树的子树森林转换成左子树,剩余树的森林转换成右子树,则上述森林的先序和中序遍历即为其对应的二叉树的先序和中序遍历。
由此可见,当以二叉链表作树的存储结构时,树的先根遍历和后根遍历可借用二叉树的先序遍历和中序遍历算法实现。
赫夫曼树又称最优树,是一类带权路径长度最短的树
路径:从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径
路径长度:路径上的分支数目称作路径长度。
树的路径长度:从树根到每一个结点的路径长度之和。完全二叉树就是路径长度最短的二叉树
结点的带权路径长度:该节点到树根之间的路径长度与结点上权的乘积
树的带权路径长度:树中所有叶子节点的带权路径长度之和 通常记作
赫夫曼树: 假设有n个权值(w1,w2…wn),试构造一棵有n个叶子结点的二叉树,每个叶子结点带权为wi ,则其中带权路径长度WPL最小的二叉树称作最优二叉树或赫夫曼树。
赫夫曼最早给出了一个带有一般规律的算法,俗称赫夫曼算法。
基本思想:
演示一下:
存储结构
struct element{
int weight;
int lchild, rchild, parent;
};
设置一个数据huffTree[2n-1] 保存赫夫曼树中个点信息,数组元素的结点结构
weight : 权值域,保存该节点的权值
lchild: 指针域,结点的左孩子结点在数组中的下标
rchild: 指针域,结点的右孩子结点在数组中的下标
parent: 指针域,该节点的双亲结点在数组中的下标
初始化:
每一棵树都是一个根节点,没有双亲也没有孩子
填入权值:
找到权值最小,且parent 为 -1 的两个结点合并,并修改其parent 值
修改k对应的左孩子右孩子对应的值:
继续循环,这里有两个5,扫描的时候会先选中前面的结点:
再循环:
伪代码: