二叉树的应用举例-哈夫曼树及哈夫曼编码

1.哈夫曼树:哈夫曼树也成为最优二叉树,在实际应用中有广泛的应用。

     叶子节点的权值:叶子节点的权值是对叶子节点赋予的一个有意义的数量值。

    设二叉树有n个带权值的叶子节点,从根节点到各个叶子节点的路径长度与相应叶子节点权值的乘积之和叫做二叉树的带权路径长度

给定一组具有确定权值的叶子节点,可以构造出不同的二叉树,将其中带权值路径长度最小的二叉树称为哈夫曼树

一棵二叉树要使其带权路径长度最小,必须使权值越大的叶子节点越靠近根节点,而使权值越小的叶子节点越远离根节点。

哈夫曼算法的基本思想:

(1).初始化:由给定的n个权值{w1,w2,w3,w4,w5,w6。。。,wn}构造n棵只有一个根节点的二叉树,从而得到一个二叉树集合F={T1,T2,T3,T4,....Tn};

(2)选取与合并:在F中选取根节点权值最小的两棵二叉树分别作为左、右子树,构造一颗新的二叉树,这棵新二叉树的根节点的权值为其左、右子树根节点的权值之和。

(3)删除与加入:在F中删除作为左、右子树的两棵二叉树,并将新建立的二叉树加入到F中.

(4)重复(2)、(3)两步,当集合F中只剩下一棵二叉树时。

a.初始化

      b .第一次合并


c.第二次合并


d.第三次合并

由以上构造过程中可以看出,在由哈夫曼法构造的哈夫曼树中,非叶子结点的度2,,根据二叉树的性质可知,具有n个叶子结点的哈夫曼树共有2n-1个结点,其中有n-1个非叶子结点,它们是在n-1次的合并过程中产生的。

2.哈夫曼编码

规定哈夫曼编码的左分支代表0,右分支代表1,则从根节点到每个叶子结点所经过的路径组成的0和1的序列便为该叶子结点对应字符的编码,称为哈夫曼编码。

对于{A,B,C,D,E}五个字符,使用的频率分别为{35,25,15,10},下面给出了哈夫曼编码和哈夫曼编码。


                                    (a)哈夫曼编码树

字符 频率 编码
A 35 11
B 25 00
C 15 01
D 15 101
E 10 100

对字符串编码的解码则是将编码串从左到右逐为判别,直到确定一个字符。这可以用生成哈夫曼树的逆过程实现






你可能感兴趣的:(数据结构与算法)