哈夫曼树应用——哈夫曼编码

在这里我们需要掌握一个知识点。

如何构建哈夫曼树

哈夫曼树怎么构建当然是他说了算的了,他给了个算法叫做哈夫曼算法。它是这么叙述的:
1.根据给定的n个权值(ω1,ω2,…,ωn)构成的n棵二叉树的集合F={T1,T2,…Tn},其中每棵二叉树Ti中只有一个带权为ωi的根结点,其左右子树均空。
2.在F中选取两棵根节点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根节点的权值为其最左和最右子树上根节点的权值之和。
3.在F中删除着两棵树,同时将新的到的二叉树加入到F中。
4.重复2和3,直到F只含一棵树为止。这棵树就是哈夫曼树。
感觉复杂吗,让我们
哈夫曼树应用——哈夫曼编码_第1张图片
给定权值为2,4,5,7,构建一棵哈夫曼树。
过程是这个样子
哈夫曼树应用——哈夫曼编码_第2张图片
要注意最后体现出来的是叶子结点,其他结点没有权值的,这里只是为了理解起来方便。此外,在构建过程中左右子树的顺序不是固定的,比如结点6的左孩子也可以是4。


了解了构建方法后,我们就可以说说应用了。我们知道电报可以实现快速远距离通信,它是将需要传送的文字转换成一串二进制编码,一个文字可以由若干二进制代码表示,但是这样就出现了一个问题。比如A的编码是0,B是00,C是01,那么编码0001就可能有多种解释,所以为了避免出现这个问题,就要要求任意一个字符的编码都不能是另一个字符的编码的前缀,这种编码就叫前缀编码,我们可以通过二叉树实现。为了节省传送时间,我们还需要将编码尽可能的缩短。总长最短意思又不能出错,如何实现呢?我们就用到了哈夫曼树。

哈夫曼编码

因为哈夫曼树本身就是一类带权路径长度最短的树,所以由它构成的二进制编码也是最短的,我们称这种二进制前缀编码为哈夫曼编码。拿刚才的例子来说,我们约定左分支表示字符’0’,右分支表示字符’1’,这样从根节点到叶子结点就会有一个串二进制代码。就像这个样子
哈夫曼树应用——哈夫曼编码_第3张图片
所以编码就是:
7:0
5:10
2:110
4:111

你可能感兴趣的:(数据结构,数据结构)