数据结构笔记整理第5章:树和二叉树

第5章 树和二叉树

本章内容

本章主要介绍树、二叉树的概念,遍历方法以及应用等,本章在考研中是重点内容。

5.1 树相关的基本概念

树是一种非线性的数据结构,是若干结点的集合,有唯一的根结点和若干棵互不相交的子树构成。其中每一棵子树又是一棵树,也是由唯一的根结点和若干棵互不相交的子树组成的,由此可知:树的定义是递归的。树的结点数目可以为0,为0的时候是一棵空树。

结点:结点不仅包含数据元素,而且包含指向子树的分支。
结点的度:结点拥有子树的个数或者分支的个数。
树的度:树中各结点度的最大值。
叶子结点:终端结点,度为0的结点。
非终端结点:分支结点,内部结点,度不为0的结点。
以根结点为第一层,以此类推。
树的高度(深度):树中结点的最大层次。
结点的深度:从根结点开始计算,根结点深度为1。
结点的高度:从底层叶子结点开始计算,叶子结点高度为1。
有序树:树中结点子树从左到右有序,不能交换。
丰满树:出最底层外,其他层都是满的。
森林:若干棵互不相交的树的集合。

5.2 树的存储结构

双亲存储结构:一种顺序存储结构,知道了i,tree[i]为其双亲结点。
孩子存储结构:同图中的邻接表存储。

5.3 二叉树的相关的基本概念

一般的树加上如下的两个限制条件,就得到了二叉树:每个结点最多只有两棵子树,即二叉树中结点的度只能为0,1以及2;子树有左右之分,不能颠倒。
满二叉树:所有的分支结点都有左孩子和右孩子结点,并且叶子结点都集中在二叉树的最下层,这样的二叉树称为满二叉树。对满二叉树编号:编号从1开始,从上到下、从左到右进行。
完全二叉树:一棵深度为K有n个结点的二叉树进行编号后,各结点的编号与深度为K的满二叉树上相同位置的结点的编号相同。一棵完全二叉树一定是由一棵满二叉树从右至左、从下至上挨个删除结点所得到的。

5.4 二叉树的主要性质

1.非空二叉树上叶子结点数等于双分支结点数加1,即总分支数 = 总结点数 - 1
2.二叉树的第i层上最多有(i >= 1)个结点
3.高度(或深度)为K的二叉树最多有个结点,换句话说:满二叉树中前K层结点个数为:
4.有n个结点的完全二叉树,对各结点从上到下,从左到右依次编号(范围1~n),则结点之间的关系,若i为某结点编号,则:
若i≠1,双亲编号⌊i/2⌋;
若2i≤n,左孩子为2i,若2i>n,无左孩子;
若2i+1≤n,右孩子为2i+1,若2i+1>n,无右孩子;
5.n个结点,构成h(n)种不同的二叉树,则:

6.n个结点的完全二叉树高度(深度)为:

5.5 二叉树的存储结构

顺序存储:最适合于完全二叉树,使用顺序存储结构要从数组下标为1开始。这里要注意区分树的顺序存储结构和二叉树的顺序存储结构:
树:数组下标代表结点的编号,内容表示结点之间的关系;
二叉树:数组下标既指示了编号又指示了关系。
链式存储:

typedef struct BTNode {
    char data;
    struct BTNode *lchild;
    struct BTnode *rchild;
}BTNode;

5.6 树、森林与二叉树的转换

将树转换为二叉树:同一结点的各孩子结点用线串起来,将每个结点的分支从左往右除了第一个以外,其余全部剪掉,擦掉虚线,连成实线,得到二叉树。
【例子1】树转换为二叉树


将森林转换为二叉树:根据孩子兄弟的法则,根结点没有右兄弟,所以转换为二叉树没有右孩子。将森林中第二棵树转换成的二叉树,当作第一棵树的右子树,依此类推。
【例子2】森林转换为二叉树


5.7 二叉树的遍历算法

包括:先序遍历、中序遍历、后序遍历和层次遍历。
先序遍历:
如果二叉树为空数,什么都不做。
否则,访问根节点->先序遍历左子树->先序遍历右子树

/* pre order by recursion method */
void preOrder(BTNode *p) {
    if (p != null) {
        visit(p->data);
        preOrder(p->lchild);
        preOrder(p->rchild);
    }
}

/* pre order by no recursion method */
void preOrder(BTNode *p) {
    Stack  s;
    BTNode *q;
    q = p;
    s.initial();
    while(q != null || !s.empty()) {
        if (q != null) {
            visit(q->data);
            s.push(q);
            q = q->lchild;  
        }
        else {
            s.pop(q);
            q = q->rchild;
        }
    } 
}

中序遍历:
如果二叉树为空数,什么都不做。
否则,中序遍历左子树->访问根结点->中序遍历右子树

/* in order by recursion method */
void inOrder(BTNode *p) {
    if (p != null) {
        inorder(p->lchild);
        visit(p->data);
        inorder(p->rchild);
    }
}

/* in order by no recursion method */
void inOrder(BTNode *p) {
    Stack  s;
    BTNode *q = p;
    s.initial();
    while(q != null || !s.empty()) {
        if (q != null) {
            s.push(q);
            q = q->lchild;
        }
        else {
            s.pop(q);
            visit(q->data);
            q = q->rchild;
        }
    }
}

后序遍历:
如果二叉树为空数,什么都不做。
否则,后序遍历左子树->后序遍历右子树->访问根结点

/* post order by recursion method */
void postOrder(BTNode *p) {
    if (p != null) {
        postOrder(p->lchild);
        postOrder(p->rchild);
        visit(p->data);
    }
}

/* post order by no recursion method */
void postOrder(BTNode *p) {
    Stack  s;
    Stack  tag;
    BTNode *q = p;
    int f;
    s.initial();
    tag.initial();
    while(q != null || !s.empty()) {
        if (q != null) {
            s.push(q);
            q = q->lchild;
            tag.push(1);
        }
        else {
            s.pop(q);
            tag.pop(f);
            if (f == 1) {
                s.push(q);
                tag.push(2);
                q = q->rchild;
            }
            else {
                visit(q->data);
                q = null;
            }
        }
    }
}

层次遍历:
按照一定的方向(如从左至右,从上至下)每一层次对二叉树各个结点进行访问。要进行层次遍历,需要建立一个循环队列,先将二叉树头结点入队列,然后出队列,访问该结点,如果有左子树,则左子树根结点入队;如果有右子树,则右子树根结点入队。出队列,访问出队列结点,如此反复直到队列空为止。

void levelOrder(BTNode *p) {
    Queue  q;
    BTNode *r;
    q.initial();
    if (p != null) {
        q.push(p);
        while(!q.empty()) {
            q.pop(r);
            visit(r->data);
            if (r->lchild != null) {
                q.push(r->lchild);
            }
            if (r->rchild != null) {
                q.push(r->rchild);
            }
        }
    }
}

【例子3】二叉树的遍历结果

先序遍历:A->B->C->D->E->F->G->H
中序遍历:C->B->E->D->F->A->H->G
后序遍历:C->E->F->D->B->H->G->A
层次遍历:A->B->G->C->D->H->E->F

5.8 树和森林的遍历算法

树的遍历:
先根遍历:先访问根结点、再访问子树。
后根遍历:先访问子树,再访问根结点。
树的先根遍历对应二叉树的先序遍历。
树的后根遍历对应二叉树的中序遍历。
森林的遍历:
先序遍历:对应二叉树的先序遍历,先访问第一棵树的根结点,先序遍历第一棵树中根结点的子树,先序遍历森林中除去第一棵树的其他树。
中序遍历:对应二叉树的中序遍历,中序遍历第一棵树根结点的子树,访问第一棵树的根结点,中序遍历森林中除去第一棵树的其他树。

5.9 线索二叉树


ltag=0:lchild为指针,指向结点左孩子;ltag=1,表示lchild为线索,指向结点直接前驱。
rtag=0:rchild为指针,指向结点右孩子;rtag=1,表示rchild为线索,指向结点直接后驱。

typedef struct TBTNode {
    char data;
    int ltag, rtag;
    struct TBTNode *lchild;
    struct TBTNode *rchild;
} TBTNode;

5.10 二叉排序树(BST)

这部分内容主要应用在“查找或者排序部分”。二叉排序树或者是空树,或者是满足以下性质的二叉树:
若左子树不空,则左子树所有值 < 根
若右子树不空,则右子树所有值 > 根
左右子树各是一棵二叉排序树
输出二叉排序树的中序遍历,则该输出序列为递增序列。

typedef struct BTNode {
    int key;
    struct BTNode *lchild;
    struct BTNode *rchild;
} BTNode;

5.11 平衡二叉树(AVL)

这部分内容主要应用在“查找或者排序部分”。
左右子树都是平衡二叉树,并且左右子树的高度之差的绝对值不超过1(引入了平衡因子的概念)。
一个结点的平衡因子:左子树高度 - 右子树高度。取值:-1,0,1
当失去平衡的最小子树被调整为平衡子树之后,无需调整原有其他所有不平衡子树,整个二叉排序树会成为一棵平衡二叉树。
最小子树:以距离插入结点最近,且平衡因子绝对值大于1的结点作为根的子树。

将失去平衡的二叉树进行平衡调整有4种情况:LL型、RR型、LR型和RL型。
LL型:在左子树根结点的右子树上插入结点 -> 右旋
LR型:在左子树根结点的右子树上插入结点 -> 左旋 + 右旋
RR型:在右子树根结点的右子树上插入结点 -> 左旋
RL型:在右子树根结点的左子树上插入结点 -> 右旋 + 左旋

【例子4】平衡二叉树的插入删除和平衡调整
以关键字{16、3、7、11、9、26、18、14、15}构造一棵AVL树,构造完成后依次删除16、15、11

插入部分:


删除部分:

5.12 B-树与B+树

B-树可以看作是二叉排序树的扩展,二叉排序树是二路查找,B-树的多路查找。因为B-树结点内的关键字是有序的,在结点内查找的时候除了顺序查找外,可以用折半查找。B-树需要满足以下条件:
每个结点最多有m个分支(子树);而最少分支棵树要看是否为根结点,根结点最少两个分支,非根结点最少有个分支;
有n个分支的结点有n-1个关键字,从左至右递增顺序排列;
各个底层是叶结点,叶结点下面是失败结点(空指针表示)。

B+树是B-树的一种变形。它们之间的差别主要有:
B+树中,n个关键字的结点含有n个分支,B-树中有n+1个分支;
B+树中叶子结点包含信息,并且包含了全部关键字,B-树的叶子只包含关键字(索引)
由于这里并不是考研重点考察的部分,所以关于B+树和B-树的详细操作会在后面的文章中单独描述。

5.13 哈夫曼树和哈夫曼编码

哈夫曼树是最优二叉树,带权路径最短。
路径:树中一个结点到另一个结点分支构成的路线。
路径长度:路径上的分支数目。
树的路径长度:从根到每个结点的路径长度之和。
带权路径长度:结点有权值,结点到根之间的路径长度乘以结点的权值。
**树的带权路径长度:**WPL,树中所有叶子结点带权路径长度之和。

哈夫曼树的特点:权值越大的结点,距离根结点越近。树中没有度为1的结点的哈夫曼树称为严格(正则)二叉树。

哈夫曼树的构造方法:
给定n个权值
(1)将n个权值看作只有根的n棵二叉树,集合记为F。
(2)F中挑选两棵根结点权值最小的(a, b)作为左右子树,构成新树c。
(3)F中删除a与b,加入c。

【例子5】哈夫曼树的构建

哈夫曼编码:
前缀编码:任一字符的编码都不是另一个字符编码的前缀。
而哈夫曼编码就是长度最短的前缀编码。对构造好的哈夫曼树,左分支表示0,右分支表示1(根据题目要求来)

【例子6】哈夫曼编码
A、B、C、D的权值(或者出现频率)为0.4、0.3、0.1和0.2,求哈夫曼编码。

你可能感兴趣的:(数据结构)