霍夫曼编码的改进

首先说一说经典霍夫曼编码。
把符号按照出现概率排序,合并概率最小的两项,为新的节点。然后重复排序、合并的步骤,直到只剩下一个节点。最后,从根节点开始,向叶节点进行编码。
改进后的霍夫曼编码,不再是二进制的。它可以是多进制,例如26进制。操作方法:
把符号按出现概率排序,合并概率最小的26项,为新的节点。然后重复这一过程,剩下的步骤与经典霍夫曼编码相同。
应用:把汉语单字读音的416音按26进制进行霍夫曼编码,结果,像de,shi,yu这些概率高的读音分配了较短的编码;dia,den这些不常用的读音分配较长的编码。26进制对应键盘的26键,这样就诞生了一种新的输入法。

你可能感兴趣的:(笔记)