最优二叉树-哈夫曼树及哈夫曼编码

一、相关概念
叶子结点的权值:对叶子结点赋予的一个有意义的数值量。
二叉树的带权路径长度:设二叉树具有n个带权值的叶子结点,从根结点到各个叶子结点的路径长度与相应叶子结点权值的乘积之和。 记为:
最优二叉树-哈夫曼树及哈夫曼编码_第1张图片
哈夫曼树:给定一组具有确定权值的叶子结点,带权路径长度最小的二叉树。

哈夫曼树的特点:

  1. 权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。
  2. 只有度为0(叶子结点)和度为2(分支结点)的结点,不存在度为1的结点.

哈夫曼算法基本思想:
⑴ 初始化:由给定的n个权值{w1,w2,…,wn}构造n棵只有一个根结点的二叉树,从而得到一个二叉树集合F={T1,T2,…,Tn};
⑵ 选取与合并:在F中选取根结点的权值最小的两棵二叉树分别作为左、右子树构造一棵新的二叉树,这棵新二叉树的根结点的权值为其左、右子树根结点的权值之和;
⑶ 删除与加入:在F中删除作为左、右子树的两棵二叉树,并将新建立的二叉树加入到F中;
⑷ 重复⑵、⑶两步,当集合F中只剩下一棵二叉树时,这棵二叉树便是哈夫曼树。

二、哈夫曼算法的存储结构
设置一个数组huffTree[2n-1]保存哈夫曼树中各点的信息,数组元素的结点结构 :
最优二叉树-哈夫曼树及哈夫曼编码_第2张图片

weight:权值域,保存该结点的权值;
lchild:指针域,结点的左孩子结点在数组中的下标;
rchild:指针域,结点的右孩子结点在数组中的下标;
parent:指针域,该结点的双亲结

struct element
{     int weight;
      int lchild, rchild, parent;
};

void HuffmanTree(element huffTree[ ], int w[ ], int n ) {
    for (i=0; i<2*n-1; i++) {
       huffTree [i].parent= -1;
       huffTree [i].lchild= -1;
       huffTree [i].rchild= -1;   
    }
    for (i=0; i<n; i++) 
       huffTree [i].weight=w[i];
    for (k=n; k<2*n-1; k++) {
        Select(huffTree, &i1, &i2); 
        huffTree[k].weight=huffTree[i1].weight+huffTree[i2].weight;
        huffTree[i1].parent=k;     
        huffTree[i2].parent=k; 
        huffTree[k].lchild=i1;    
        huffTree[k].rchild=i2;
    }
}

哈夫曼树应用——哈夫曼编码
前缀编码:一组编码中任一编码都不是其它任何一个编码的前缀
叶子结点到根, 逆向求每个叶子结点对应的哈夫曼编码,根据huffman树中叶子节点的个数,构造一个字符串数组,每个数组分量是一个字符串,用于存放该节点对应的huffman编码

三、线索二叉树
在有n个结点的二叉链表中共有2n个链域,但只有n-1个有用的非空链域,其余n+1个链域是空的。
我们可以利用剩下的n+1个空链域来存放遍历过程中结点的前驱和后继信息。
线索:将二叉链表中的空指针域指向前驱结点和后继结点的指针被称为线索;
线索化:使二叉链表中结点的空链域存放其前驱或后继信息的过程称为线索化;
线索二叉树:加上线索的二叉树称为线索二叉树

结点结构:
在这里插入图片描述
最优二叉树-哈夫曼树及哈夫曼编码_第3张图片

enum flag {Child, Thread}; 
template  <class T>
struct ThrNode
{
     T data;
     ThrNode<T>  *lchild, *rchild;
     flag ltag, rtag;
};

中序线索链表类的声明

template <class T>
class InThrBiTree{    
   public:
        InThrBiTree();     
         ~ InThrBiTree( );    
        ThrNode *Next(ThrNode<T> *p); 
        void InOrder(ThrNode<T> *root); 
   private:
        ThrNode<T> *root;  
        ThrNode<T> *  Creat(); 
        void ThrBiTree(ThrNode<T> *root);
};

建立带有标志位的二叉链树

template <class T>ThrNode<T>* InThrBiTree<T>::Creat( ){
    ThrNode<T> *root;
    T ch;
    cout<<"请输入创建一棵二叉树的结点数据"<<endl;
    cin>>ch;
    if (ch=="#") root = NULL;
    else{	
         root=new ThrNode<T>;    
         root->data = ch;
         root->ltag = Child; root->rtag = Child;
         root->lchild = Creat( );
         root->rchild = Creat( ); 
    } 
	return root;
}

中序线索化二叉树:递归实现

template <class T>  void ThrBiTree<T>::ThrBiTree (ThrNode<T>*root)
{
    if (root==NULL)
        return;         //递归结束条件
    ThrBiTree(root->lchild);
    if (!root->lchild)              //对root的左指针进行处理
    {
        root->ltag = Thread;
        root->lchild = pre;        //设置pre的前驱线索
    }
    if (!root->rchild)
        root->rtag = Thread;
    if(pre != NULL)
    {
        if (pre->rtag==Thread)
            pre->rchild = root;
    }
    pre = root;
    ThrBiTree(root->rchild);
}

线索二叉树的建立

ThrNode<T>* pre = NULL
template <class T>
InThrBiTree<T>::InThrBiTree( )
{ 
	//ThrNode* pre = NULL;
	this->root = Creat( );    
	ThrBiTree(root);
}

在中序线索树中查找结点的中序遍历的后继

template <class T> ThrNode<T>* InThrBiTree<T>::Next(ThrNode<T>* p)
{
    ThrNode<T>* q;  //要查找的p的后继
    if (p->rtag==Thread)   q = p->rchild;
    else{   
        q = p->rchild; 
        while (q->ltag==Child)	{
            q = q->lchild;
        }
    }
    return q;
}
template <class T> 
void InThrBiTree<T>::InOrder(ThrNode<T> *root){
    ThrNode<T>* p = root;
    if (root==NULL)  return; 
    while (p->ltag==Child)   {       p = p->lchild;    }
    cout<<p->data<<" ";
    while (p->rchild!=NULL) {
        p = Next(p);
        cout<<p->data<<" ";
    }
    cout<<endl;
}

最优二叉树-哈夫曼树及哈夫曼编码_第4张图片

你可能感兴趣的:(数据结构课程笔记)