哈夫曼树,及哈夫曼编码的构造

最近看到腾讯一个关于哈夫曼编码的题目(如下)

某段文本中各个字母出现的频率分别是{a:4,b:3,o:12,h:7,i:10},使用哈夫曼编码,则哪种是可能的编码:()

  • a(000)  b(001)  h(01)  i(10)  o(11)
  • a(0000)  b(0001)  h(001)  o(01)  i(1)
  • a(000)  b(001)  h(01)  i(10)  o(00)
  • a(0000)  b(0001)  h(001)  o(000)  i(1)

本来开始觉得很简单(因为之前有学过这方面的问题)

结果一头雾水,用了下百度神器。果然奏效。

为了防止日后有忘记,故写文档加以保存

首先:创建一个哈夫曼树

原则如下:

1. 将每个英文字母依照出现频率由小排到大,最小在左,组成一个序列

2. 每个字母都代表一个终端节点(叶节点),比较每个字母的出现频率,将最小的两个字母频率相加合成一个新的节点,将两个字母从序列中删除,将生成的节点加入到字母队列中

3. 重复前面两步,直到序列中没有字母为止

进行编码:

1. 给霍夫曼树的所有左链结'0'与右链结'1'

2. 从树根至树叶依序记录所有字母的编码


好:我们先来构造

v = {b(3),a(4),h(7),i(10),o(12)}

取最小两个权值构成一棵树(如下)

--------(7)

---------/---\

-------/------\

-----b(3)---a(4)

然后将(7)加入序列:(7),h(7),i(10),o(12)

再取最小两个权值构成树:如下

-----------------(14)

--------------/--------\

------------/------------\

--------(7)---------h(7)

---------/---\

-------/------\

-----b(3)---a(4)

将(14)加入权值序列: (14) ,i(10),o(12)

现在取10跟12构成一颗新数:如下

----------------(14)------------------(22)

--------------/--------\----------------/-----\

------------/------------\ -----------/----------\

--------(7)---------h(7)  ---i(10)--------o(12)

---------/---\

-------/------\

-----b(3)---a(4)

最好权值相加:

--------------------------(36)

--------------------/-----------------\

------------------/---------------------\

----------------(14)------------------(22)

--------------/--------\----------------/-----\

------------/------------\ -----------/----------\

--------(7)---------h(7)  ---i(10)--------o(12)

---------/---\

-------/------\

-----b(3)---a(4)

现在执行哈夫曼编码:从第二个接点开始:

进行编码:

1. 给霍夫曼树的所有左链结'0'与右链结'1'

2. 从树根至树叶依序记录所有字母的编码

--------------------------(36)

--------------------/-----------------\

------------------/---------------------\

----------------0(14)------------------1(22)

--------------/--------\----------------/-----\

------------/------------\ -----------/----------\

--------0(7)---------1h(7)  ---0i(10)--------1o(12)

---------/---\

-------/------\

-----0b(3)---1a(4)

结果:a:001,b000,h01,i10,o11

答案a



你可能感兴趣的:(C++,编码,腾讯)