第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码

一、带权路径长度

1.结点的权:有某种现实含义的数值(如:表示结点的重要性等)

2.结点的带权路径长度:从树的根到该结点的路径长度(经过的边数)与该结点上权值的乘积。

3.树的带权路径长度:树中所有叶结点的带权路径长度之和。(WPL)

二、例子

1.

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第1张图片

所有叶子节点的带权路径之和

WPL=(1*2)+(3*2)+(4*2)+(5*2)= 26

2.

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第2张图片

WPL=(5*1)+(4*2)+(3*3)+(1*3)= 25

定义:我们知道,每个二叉树都可以有多种不同的表示方法,其中,在含有n个带权叶结点的二叉树中,其中带权路径长度(WPL))最小的二叉树称为哈夫曼树,也称最优二叉树。

三、哈夫曼树的构造

描述:

1)将这n个结点分别作为n棵仅含一个结点的二叉树,构成森林F

2)构造一个新结点,从F中选取两棵根结点权值最小的树作为新结点的左、右子树,开且将新结点的权值置为左、右子树上根结点的权值之和。

3)从F中删除刚才选出的两棵树,同时将新得到的树加入F中。

4)重复步骤2)和3),直至F中只剩下一棵树为止。

例子:假设我们有如下几个结点

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第3张图片

1.我们找出两个根权值之和最小的结点进行结合,也就是a,c,把它们的权相加,形成新的结点。

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第4张图片

3.再次找两个根权值之和最小的相加

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第5张图片

4.反复这个过程(n-1次)n为原始结点数,最终得到

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第6张图片

WPL=7+6+6+4+8=31

1)每个初始结点最终都成为叶结点,且权值越小的结点到根结点的路径长度越大。

2)哈夫曼树的结点总数为2n -1。

3)哈夫曼树中不存在度为1的结点。

4)哈夫曼树并不唯一,但WPL必然相同且为最优。


四、哈夫曼编码

定义:

由哈夫曼树得到哈夫曼编码――字符集中的每个字符作为一个叶子结点,各个字符出现的频度作为结点的权值,根据之前介绍的方法构造哈夫曼树。

用途:

用于压缩数据。
 

1、固定长度编码――每个字符用相等长度的二进制位表示

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第7张图片

2、可变长度编码――允许对不同字符用不等长的二进制位表示

(1)若一个编码是另一个编码的前缀,那么解码时可能会发生歧义

第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第8张图片

(2)若没有一个编码是另一个编码的前缀,则称这样的编码为前缀编码

这种编码不会发生歧义
第五章 树与二叉树 五、哈夫曼树(定义与构造方法),哈夫曼编码_第9张图片

你可能感兴趣的:(数据结构学习,算法,数据结构)