哈夫曼树|构建|哈夫曼编码

      在学习《数据结构》课程的时候就涉及HuffmanTree,当时没有什么算法设计的概念,就是参照着伪代码慢慢敲写、调试、重复。最终还是理解看懂了,不过也是花费了很多的时间。最近在《算法设计与分析》课程中与HuffmanTree再次相遇,原来解决Huffman问题的算法还存在#贪心法#这类概念。预习之需,还是来进行详细总结下。
      使用的《数据结构》教材当然是严蔚敏那本经典。伪代码在书籍的147页。当初对算法没有什么清晰的概念[当然,不懂什么叫做#贪心法#],能解决问题、把自己的想法实现出来就会感觉到成就感。还是依照书籍上来描述下Huffman算法吧!
      首先,我们具备的数据源有:在一篇只含有"a"、"b"、"c"、"d"、"e"、"f"字符的文章中[当然是"假设"],每个字符依次出现的次数为45、13、12、16、9、5(如下图)。

      现在要对这些数据进行数学化处理。这些出现的次数就是构造HuffmanTree中的权值集合weight{w1,w2,...wi...w6}。现在我们对6个字符进行Huffman编码,这就如同在HuffmanTree中存在6片叶子;HuffmanTree是最优二叉树,所以构造的HuffmanTree整个结点数目为12个。
      算法实现的具体过程:
      [1].根据给定的n个权值weight{w1,w2,...wi...wn}构成n棵二叉树的集合F = { T1 , T2 , ... Ti ... Tn},其中每棵二叉树Ti中只有一个带权值为wi的根结点,其左右字树为空。
      [2].在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为左、右子树上根结点的权值之和。
      [3].在F中删除这两棵树,同时将新得到的二叉树加入F中。
      [4].重复[2]和[3],直到F只含一棵树为止。到此,这最终的树即为赫夫曼树。
      利用以上的数据,HuffmanTree的建树过程基本如下图所示:


      实现算法的代码比较长,这里提供一张代码截图,您也可以 点击下载。其实,已经许久没有使用纯C语言来写算法了,C的许多概念都已经忘却。在开始学习C语言的时候,总是喜欢掺杂许多C++的概念;毕竟是第一门编程语言,现在却几乎什么都忘掉了;曾经的迷惑,如今的荒唐,何时是尽头。 转载请保留地址: http://blog.iliyang.cn/

你可能感兴趣的:(哈夫曼树,哈夫曼编码)