数据结构——哈夫曼树

一.简介

给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的路径长度是从树根到每一结点的路径长度之和,记为WPL=(W1L1+W2L2+W3L3+…+WnLn),N个权值Wi(i=1,2,…n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,…n)。可以证明霍夫曼树的WPL是最小的。

二.基本术语

1.路径和路径长度

在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1。

2.结点的权及带权路径长度

若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。

3.树的带权路径长度

树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。

三.构造

假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:
(1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);
(2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;
(3)从森林中删除选取的两棵树,并将新树加入森林;
(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。
图解过程数据结构——哈夫曼树_第1张图片

四.编码

利用哈夫曼树求得的二进制编码称为哈夫曼编码。树中从根到每个叶子节点都有一条路径,对路径上的各分支约定指向左子树的分支表示”0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为各个叶子节点对应的字符编码,即是哈夫曼编码。

就拿上图例子来说:

A,B,C,D对应的哈夫曼编码分别为:111,10,110,0

用图说明如下:
数据结构——哈夫曼树_第2张图片

五.例题及代码实现

数据结构——哈夫曼树_第3张图片
C++实现

#include 
#include 
#include 

typedef int ELEMTYPE;

   // 哈夫曼树结点结构体
   typedef struct HuffmanTree
   {
      ELEMTYPE weight;
      ELEMTYPE id;        // id用来主要用以区分权值相同的结点,这里代表了下标
      struct HuffmanTree* lchild;
      struct HuffmanTree* rchild;
  }HuffmanNode;

  // 构建哈夫曼树
  HuffmanNode* createHuffmanTree(int* a, int n)
  {
      int i, j;
      HuffmanNode **temp, *hufmTree;
      temp = malloc(n*sizeof(HuffmanNode));
      for (i = 0; iweight = a[i];
          temp[i]->id = i;
          temp[i]->lchild = temp[i]->rchild = NULL;
      }

      for (i = 0; iweight < temp[small1]->weight)
                  {
                      small2 = small1;
                      small1 = j;
                  }
                  else if (temp[j]->weight < temp[small2]->weight)
                  {
                      small2 = j;
                  }
              }
          }
         hufmTree = (HuffmanNode*)malloc(sizeof(HuffmanNode));
         hufmTree->weight = temp[small1]->weight + temp[small2]->weight;
         hufmTree->lchild = temp[small1];
         hufmTree->rchild = temp[small2];

         temp[small1] = hufmTree;
         temp[small2] = NULL;
     }
     free(temp);
     return hufmTree;
 }

 // 以广义表的形式打印哈夫曼树
 void PrintHuffmanTree(HuffmanNode* hufmTree)
 {
     if (hufmTree)
     {
         printf("%d", hufmTree->weight);
         if (hufmTree->lchild != NULL || hufmTree->rchild != NULL)
         {
             printf("(");
             PrintHuffmanTree(hufmTree->lchild);
             printf(",");
             PrintHuffmanTree(hufmTree->rchild);
             printf(")");
         }
     }
 }

 // 递归进行哈夫曼编码
 void HuffmanCode(HuffmanNode* hufmTree, int depth)      // depth是哈夫曼树的深度
 {
     static int code[100];
     if (hufmTree)
     {
         if (hufmTree->lchild == NULL && hufmTree->rchild == NULL)
         {
             printf("id为%d权值为%d的叶子结点的哈夫曼编码为 ", hufmTree->id, hufmTree->weight);
             int i;
             for (i = 0; ilchild, depth + 1);
             code[depth] = 1;
             HuffmanCode(hufmTree->rchild, depth + 1);
         }
     }
 }

 // 哈夫曼解码
 void HuffmanDecode(char ch[], HuffmanNode* hufmTree, char string[])     // ch是要解码的01串,string是结点对应的字符
 {
     int i;
     int num[500];
     HuffmanNode* tempTree = NULL;
     for (i = 0; ilchild != NULL && tempTree->rchild != NULL)
             {
                 if (num[i] == 0)
                 {
                     tempTree = tempTree->lchild;
                 }
                 else
                 {
                     tempTree = tempTree->rchild;
                 }
                 ++i;
             }
             printf("%c", string[tempTree->id]);     // 输出解码后对应结点的字符
         }
     }
 }

 int main()
 {
     int i, n;
     printf("请输入叶子结点的个数:\n");
     while (1)
     {
         scanf("%d", &n);
         if (n>1)
             break;
         else
             printf("输入错误,请重新输入n值!");
     }

     int* arr;
     arr = (int*)malloc(n*sizeof(ELEMTYPE));
     printf("请输入%d个叶子结点的权值:\n", n);
     for (i = 0; i

结果数据结构——哈夫曼树_第4张图片
这里结果只用改一下就好

f}alg55fd5f50f0ddd0d00adafdd5505d50a5{
flag{ddf5dfd0f05550500a5af55dd0d5d0ad}

你可能感兴趣的:(学习笔记)