哈夫曼编码

问题

代码(码字):Q{001,00,010,01}表示字符a,b,c,d
同一序列:0100001
产生两种译码(产生歧义):01 00 001;010 00 01
二元前缀码:任何字符的代码不能作为其他字符代码的前缀
利用二元前缀码译码:从第一个字符开始一次读入每个字符(0或1),如果发现独到的字串与某个码字相等,就将这个子串译作相应的码字:然后从下一个字符开始继续这个过程,直到读完输入的字符串为止。
二元前缀编码存储:二叉树结构,每个字符作为树叶,对应这个字符的前缀码看作根到这片树叶的一条路径,每个节点通向做儿子的边记作0,通向右儿子的边记作1。
问题:给定字符集C={x1,x2,…,xn}和每个字符的频率f(xi),求关于C的一个最优前缀码。

解析

构造最优前缀码的贪心算法为哈夫曼算法。
哈夫曼编码_第1张图片

设计

1、数组haftree初始化,所有数组元素的双亲、左右孩子都置为-12、数组haftree的前n个元素的权值置给定权值; 
3、进行n-1次合并 3.1 在二叉树集合中选取两个权值最小的根节点,其下标分别为i1,i2; 3.2 将二叉树i1、i2合并为一棵新的二叉树k。

分析

时间复杂度:O(nlogn)。

源码

#include 
using namespace std;
typedef long long ll;
const int maxn=1e4;
const int inf=0x3f3f3f3f;

int main() {
    int n;
    while(~scanf("%d", &n)) {
        priority_queue<ll, vector<ll>, greater<ll> >q;
        ll res = 0;
        for (int i = 1; i <= n; ++i) {
            ll x;
            scanf("%lld", &x);
            q.push(x);
        }
        while (1) {
            ll a = q.top();
            q.pop();
            if (q.empty())break;
            ll b = q.top();
            q.pop();
            res += a + b;
            q.push(a + b);
        }
        printf("%lld\n", res);
    }
}

Github:

https://github.com/Geedhayb/Geed/blob/master/Huffman.cpp

你可能感兴趣的:(算法分析)