哈夫曼树又称最优二叉树,即WPL(树中所有叶子结点的带权路径长度之和)。
给定n个权值集合W构造n棵二叉树的集合F:
构建方式如下:
(1)把所有权值按从小到大的顺序排列,权值最小的作为根结点,其左右子数为空
(2)在F中找出两颗根结点权值最小的数作为左右子数构造新的二叉树, 新的二叉树权值为左右子树结点权值之和
(3)将新的二叉树加入到F中,再和剩余权值最小结点作为子树创建新的二叉树
(4)重复(3)直到F中只有一棵树
哈弗曼树编码:
从根结点开始,对左子树分配0,右子树分配1,一直到达叶子结点为止
然后从树根沿每条路径到达叶子节点的代码排列起来,就得到哈弗曼编码了
在下表达能力差也许没说明白,下面有个具体例子,阁下可以参考一下:
例如一个文件中有字母A5个,B6个,C10个,D4个,E2个
构建的二叉树如下图
接下来就是代码的实现了。
首先明确自己的目的:
从键盘任意输入一个字符串,用一个方法来统计每个字符的权值
然后根据权值创建二叉树然后编码
这个过程我遇到这样一个问题:
最好用Map集合存储每个字符和其权值,这样既保证每个字符和权值的对应关系,而且Map集合中的字符可以是字母,汉字,数字,和其他的字符;
如果用数组,要分几种情况讨论,难点在于汉字和其他字符的遍历
//哈弗曼树节点类
public class HfmNode {
public HfmNode left; //左子叶
public HfmNode right; //右子叶
public int data; //字符的频率
public char c; //字符的种类
}
//创建二叉树的类
import java.util.Arrays;
import java.util.Date;
import java.util.Scanner;
import java.util.Set;
import java.util.TreeMap;
public class HFMstr {
private HfmNode[] nodes; //结点数组
private static char[] charArray; //字符数组
private static String st=""; //定义从键盘输入的字符串
private static TreeMap<Character,Integer> tm; //存储字符和其对应的频率
/**
* 传入字符串,先转化为字符数组
* 再用TreeMap存储每个字符和其对应的频率
* 最后转化为结点数组
* @param str
*/
public HFMstr(String str){
charArray=str.toCharArray();
tm = new TreeMap<Character,Integer>();
for (int x = 0; x < charArray.length;x++ ){ //遍历字符数组
if(!tm.containsKey(charArray[x])){
tm.put(charArray[x],1); //向TreeMap中加入字符和他对应的频率
}else{
int count =tm.get(charArray[x])+1; //count为当前字符的频率
tm.put(charArray[x],count);
}
}
nodes = new HfmNode[tm.size()]; //按照char数组的长度创建创建结点数组
Set<Character> set = tm.keySet(); //从set集合中取出char字符
int n=0;
for(Character c : set){
nodes[n] = new HfmNode();
nodes[n].c=c;
nodes[n].data=tm.get(c); //得到相应字符的频率
n++;
}
}
//对节点数组排序
private void sort(HfmNode[] nodes){
//冒泡排序
for(int i=0; i<nodes.length; i++){
for(int j=i+1; j<nodes.length; j++){
if(nodes[i].data > nodes[j].data){
//交换:注意,交换的是位置,而不是属性
HfmNode n = nodes[i];
nodes[i] = nodes[j];
nodes[j] = n;
}
}
}
}
//创建哈弗曼树
private HfmNode createTree(){
HfmNode[] nodes = this.nodes;
while(nodes.length > 1){
sort(nodes);
//取前面两个最小的节点
HfmNode n1 = nodes[0];
HfmNode n2 = nodes[1];
//创建新节点
HfmNode n3 = new HfmNode();
n3.left = n1;
n3.right = n2;
n3.data = n1.data+n2.data;
//新建一个长度比原来小1的数组
HfmNode[] nodes2 = new HfmNode[nodes.length-1];
for(int i=2; i<nodes.length;i++){
nodes2[i-2] = nodes[i];
}
//把新节点加进来
nodes2[nodes2.length-1] = n3;
nodes = nodes2;
}
return nodes[0];
}
//打印节点
public void printCode(){
HfmNode root = createTree(); //得到二叉树的根结点
printHFM(root,"");
}
//打印编码
public void printHFM(HfmNode node, String code){
if(node != null){
if(node.left == null && node.right == null){ //输出的是叶子
System.out.println(node.c+"的编码是"+code+" "+" " +"权数是"+node.data);
}
//利用递归打印编码
printHFM(node.left,code+"0");
printHFM(node.right,code+"1");
}
}
//入口函数
public static void main(String args[]){
Scanner sc = new Scanner(System.in);
st = sc.nextLine(); //从键盘中输入一个字符串
HFMstr hs=new HFMstr(st);
hs.printCode();
}
}
//程序测试
运行结果如下:
这就是哈弗曼树的基本操作了。