Huffman树和编解码

Huffman树的建立

基本介绍
  1. 给定n个权值作为n 个叶子结点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)
  2. 赫夫曼树是带权路径长度最短的树,权值较大的结点离根较近
赫夫曼树几个重要概念
  1. 路径和路径长度:在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1
  2. 结点的权及带权路径长度:若将树中结点赋给一个有着某种含义的数值.则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积
  3. 树的带权路径长度:树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL(weighted path length) ,权值越大的结点离根结点越近的二叉树才是最优二叉树
  4. WPL最小的就是赫夫曼树
赫夫曼树创建思路

给你一个数列{13,7,8,3,29,6,1},要求转成一颗赫夫曼树.构成赫夫曼树的步骤:

  1. 从小到大进行排序,将每一个数据,每个数据都是一个节点,每个节点可以看成是一颗最简单的二叉树
  2. 取出根节点权值最小的两颗二叉树
  3. 组成一颗新的二叉树,该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和
  4. 再将这颗新的二叉树,以根节点的权值大小再次排序.不断重复1-2-3-4 的步骤,直到数列中,所有的数据都被处理,就得到一颗赫夫曼树
public class HuffmanTree {
    public static void main(String[] args) {
        int[] arr={13,7,8,3,29,6,1};
        Node huffmanTree=createHuffmanTree(arr);
        preOrder(huffmanTree);
    }

    //前序遍历
    public static void preOrder(Node root){
        if(root!=null)
            root.preOrder();
        else
            System.out.println("空树,不能遍历");
    }

    public static Node createHuffmanTree(int[] arr){
        List nodes=new ArrayList<>();
        for(int value:arr)
            nodes.add(new Node(value));
        while(nodes.size()>1)
        {
            Collections.sort(nodes);
            Node leftNode=nodes.get(0);
            Node rightNode=nodes.get(1);
            Node parentNode=new Node(leftNode.value+rightNode.value);
            parentNode.left=leftNode;
            parentNode.right=rightNode;
            nodes.remove(leftNode);
            nodes.remove(rightNode);
            nodes.add(parentNode);
        }
        return nodes.get(0);
    }

}
class Node implements Comparable{
    int value;
    Node left;
    Node right;

    public Node(int value) {
        this.value = value;
    }

    //前序遍历
    public void preOrder(){
        System.out.println(this);
        if(this.left!=null)
            this.left.preOrder();
        if(this.right!=null)
            this.right.preOrder();
    }

    @Override
    public String toString() {
        return "Node{" +
                "value=" + value +
                '}';
    }

    @Override
    public int compareTo(Node node) {
        return this.value-node.value;
    }
}

赫夫曼编解码

public class HuffmanCode {
    static Map huffmanCodes=new HashMap<>();
    static StringBuilder stringBuilder=new StringBuilder();

    public static void main(String[] args) {
        String content="asdds astkk nhb sgacsw aevsbd";
        byte[] contentBytes=content.getBytes();
        byte[] huffmanCodeBytes=huffmanZip(contentBytes);
        System.out.println(Arrays.toString(huffmanCodeBytes));
        byte[] sourceBytes=decode(huffmanCodes,huffmanCodeBytes);
        System.out.println(new String(sourceBytes));

    }

    /**
     * 将一个byte转化为一个二进制的字符串
     * @param flag 表示是否需要补高位,如果是true表示需要补高位,如果是false表示不补,如果是最后一个字节无需补高位
     * @param b
     * @return
     */
    public static String byteToBitString(boolean flag,byte b){
        int temp=b;
        if(flag)
            temp|=256;
        String str=Integer.toBinaryString(temp);
        if(flag)
            return str.substring(str.length()-8);
        else
            return str;
    }

    /**
     * 解码
     * @param huffmanCodes
     * @param huffmanBytes
     * @return
     */
    public static byte[] decode(Map huffmanCodes,byte[] huffmanBytes){
        StringBuilder stringBuilder=new StringBuilder();
        for(int i=0;i map=new HashMap<>();
        for(Map.Entryentry:huffmanCodes.entrySet()){
            map.put(entry.getValue(),entry.getKey());
        }

        List list=new ArrayList<>();
        for(int i=0;i nodes=getNodes(bytes);
        Node huffmanTreeRoot=createHuffmanTree(nodes);
        Map huffmanCodes=getCodes(huffmanTreeRoot);
        byte[] huffmanCodeBytes=zip(bytes,huffmanCodes);

        return huffmanCodeBytes;
    }

    /**
     * 一、将传入的字节数组转为List集合
     * @param bytes 传入的字节数组
     * @return List集合
     */
    private static List getNodes(byte[] bytes){
        ArrayList nodes=new ArrayList<>();
        Map counts=new HashMap<>();

        for(byte b:bytes) {
            Integer count=counts.get(b);
            if(count==null)
                counts.put(b,1);
            else
                counts.put(b,count+1);
        }

        for(Byte b:counts.keySet()){
            Node node=new Node(b,counts.get(b));
            nodes.add(node);
        }
        return nodes;
    }

    /**
     * 二、构建Huffman树
     * @param nodes Node集合
     * @return 根节点
     */
    public static Node createHuffmanTree(List nodes){
        while(nodes.size()>1)
        {
            Collections.sort(nodes);
            Node leftNode=nodes.get(0);
            Node rightNode=nodes.get(1);
            Node parentNode=new Node(null,leftNode.weight+rightNode.weight);
            parentNode.left=leftNode;
            parentNode.right=rightNode;

            nodes.remove(leftNode);
            nodes.remove(rightNode);
            nodes.add(parentNode);
        }
        return nodes.get(0);
    }

    //重载
    public static Map getCodes(Node root){
        if(root==null)
            return null;
        else{
            getCodes(root.left,"0",stringBuilder);
            getCodes(root.right,"1",stringBuilder);
        }
        return huffmanCodes;
    }

    /**
     * 三、获取Huffman编码表
     * @param node 节点
     * @param code 路径:左子节点为0,右子节点为1
     * @param stringBuilder 拼接路径(编码)
     */
    public static void getCodes(Node node,String code,StringBuilder stringBuilder){
        StringBuilder stringBuilder2=new StringBuilder(stringBuilder);
        stringBuilder2.append(code);
        if(node!=null){
            if(node.data==null){
                getCodes(node.left,"0",stringBuilder2);
                getCodes(node.right,"1",stringBuilder2);
            }
            else
                huffmanCodes.put(node.data,stringBuilder2.toString());
        }
    }

    /**
     * 四、将原始数组转化为压缩后的字节数组
     * @param bytes 原始字节数组
     * @param huffmanCodes 编码表
     * @return 压缩后的字节数组
     */
    private static byte[] zip(byte[] bytes,Map huffmanCodes){
        StringBuilder stringBuilder=new StringBuilder();
        for(byte b:bytes){
            stringBuilder.append(huffmanCodes.get(b));
        }
        int len=(stringBuilder.length()+7)/8;
        byte[] huffmanCodeBytes=new byte[len];
        int index=0;
        for(int i=0;istringBuilder.length())
                strByte=stringBuilder.substring(i);
            else
                strByte=stringBuilder.substring(i,i+8);
            huffmanCodeBytes[index]=(byte)Integer.parseInt(strByte,2);
            index++;
        }
        return huffmanCodeBytes;
    }
}

你可能感兴趣的:(Huffman树和编解码)