Huffman-哈夫曼编码算法详解

1. 概述&背景

哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在20%~90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一
个用0,1串表示各字符的最优表示方式。给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。
在学习哈夫曼编码之前,首先应了解前缀码:对每一个字符规定一个0,1串作为其代码,并要求任一字符的代码都不是其它字符代码的前缀,这种编码称为前缀码。比如:01,001,011就不满足前缀码的性质,因为011中包含01。而哈夫曼编码必须要满足前缀码的性质,否则会导致译码的时候出现多种译码方式,违背的唯一性准则。

2. 哈夫曼编码

哈夫曼编码的基本思想为:循环地选择具有最低频率的两个结点,生成一棵子树,直至形成树。我们通过一个例子来理解一下:
题目给出待编码的符号以及出现的频率,如下图所示:
在这里插入图片描述
每次选择频率最小的两个符号,依次建树,并把这两个最小频率加和,用这个和来替换原来最小的两个频率:
Huffman-哈夫曼编码算法详解_第1张图片
Huffman-哈夫曼编码算法详解_第2张图片
Huffman-哈夫曼编码算法详解_第3张图片
Huffman-哈夫曼编码算法详解_第4张图片
Huffman-哈夫曼编码算法详解_第5张图片

3. 算法描述:

Huffman(C, F)
{
	n <- |C|;
	Q <- C;
	FOR i <- 1 To n-1 Do
		z <- Allocate-Node();
		// 使用二叉堆找到出现频率最小的节点并置为左孩子lch
		x <- left[z] <- Extract-MIN(Q);
		// 使用二叉堆找到出现频率次小的节点并置为右孩子rch 
		y <- right[z] <- Extract-MIN(Q);
		f(z) <- f(x) + f(y);
		Insert(Q, z);
	Return;
}

4. 代码:

参考链接:https://www.cnblogs.com/gyk666/p/6851821.html

//
// Created by 23011 on 3/4/2022.
//
#include
#include
using namespace std;
struct Node
{
    double weight;
    string ch;
    string code;
    int lchild, rchild, parent;
};

void Select(Node huffTree[], int *a, int *b, int n)//找权值最小的两个a和b
{
    int i;
    double weight = 0; //找最小的数
    for (i = 0; i <n; i++)
    {
        if (huffTree[i].parent != -1)     //判断节点是否已经选过
            continue;
        else
        {
            if (weight == 0)
            {
                weight = huffTree[i].weight;
                *a = i;
            }
            else
            {
                if (huffTree[i].weight < weight)
                {
                    weight = huffTree[i].weight;
                    *a = i;
                }
            }
        }
    }
    weight = 0; //找第二小的数
    for (i = 0; i < n; i++)
    {
        if (huffTree[i].parent != -1 || (i == *a))//排除已选过的数
            continue;
        else
        {
            if (weight == 0)
            {
                weight = huffTree[i].weight;
                *b = i;
            }
            else
            {
                if (huffTree[i].weight  < weight)
                {
                    weight = huffTree[i].weight;
                    *b = i;
                }
            }
        }
    }
    int temp;
    if (huffTree[*a].lchild < huffTree[*b].lchild)  //小的数放左边
    {
        temp = *a;
        *a = *b;
        *b = temp;
    }
}

void Huff_Tree(Node huffTree[], int w[], string ch[], int n)
{
    for (int i = 0; i < 2 * n - 1; i++) //初始过程
    {
        huffTree[i].parent = -1;
        huffTree[i].lchild = -1;
        huffTree[i].rchild = -1;
        huffTree[i].code = "";
    }
    for (int i = 0; i < n; i++)
    {
        huffTree[i].weight = w[i];
        huffTree[i].ch = ch[i];
    }
    for (int k = n; k < 2 * n - 1; k++)
    {
        int i1 = 0;
        int i2 = 0;
        Select(huffTree, &i1, &i2, k); //将i1,i2节点合成节点k
        huffTree[i1].parent = k;
        huffTree[i2].parent = k;
        huffTree[k].weight = huffTree[i1].weight + huffTree[i2].weight;
        huffTree[k].lchild = i1;
        huffTree[k].rchild = i2;
    }
}
void Huff_Code(Node huffTree[], int n)
{
    int i, j, k;
    string s = "";
    for (i = 0; i < n; i++)
    {
        s = "";
        j = i;
        while (huffTree[j].parent != -1) //从叶子往上找到根节点
        {
            k = huffTree[j].parent;
            if (j == huffTree[k].lchild) //如果是根的左孩子,则记为0
            {
                s = s + "0";
            }
            else
            {
                s = s + "1";
            }
            j = huffTree[j].parent;
        }
        cout << "字符 " << huffTree[i].ch << " 的编码:";
        for (int l = s.size() - 1; l >= 0; l--)
        {
            cout << s[l];
            huffTree[i].code += s[l]; //保存编码
        }
        cout << endl;
    }
}

string Huff_Decode(Node huffTree[], int n,string s)
{
    cout << "解码后为:";
    string temp = "",str="";//保存解码后的字符串
    for (int i = 0; i < s.size(); i++)
    {
        temp = temp + s[i];
        for (int j = 0; j < n; j++)
        {
            if (temp == huffTree[j].code)
            {
                str=str+ huffTree[j].ch;
                temp = "";
                break;
            }
            else if (i == s.size()-1&&j==n-1&&temp!="")//全部遍历后没有
            {
                str= "解码错误!";
            }
        }
    }
    return str;
}

int main()
{
    //编码过程
    const int n=5;
    Node huffTree[2 * n];
    string str[] = { "A", "B", "C", "D", "E"};
    int w[] = { 30, 30, 5, 20, 15 };
    Huff_Tree(huffTree, w, str, n);
    Huff_Code(huffTree, n);
    //解码过程
    string s;
    cout << "输入编码:";
    cin >> s;
    cout << Huff_Decode(huffTree, n, s)<< endl;;
    system("pause");
    return 0;
}

Huffman-哈夫曼编码算法详解_第6张图片

你可能感兴趣的:(算法,贪心算法)