Java实现哈夫曼编码和解码

最近无意中想到关于api返回值加密的问题,譬如我们的api需要返回一些比较敏感或者重要不想让截获者得到的信息,像如果是做原创图文的,文章明文返回的话则有可能被抓包者窃取。

关于请求时加密的方式比较多,像常见的如阿里某api就是根据所有参数ascii码升序排序并加盐加密,这样能避免黑客篡改请求值。那关于返回值加密的,我觉得用哈夫曼编码就不错。

大家都知道哈夫曼是用来做压缩解压的算法,通过哈夫曼压缩后的数据其实就相当于加密了,我们可以把返回值用哈夫曼算法压缩得到一串的0101,然后再随便头尾补个乱码什么的值,到客户端再把乱码去除,在一定程度上就能让截获者迷惑了,而且传输的数据量也小了一些,节省流量。

这里有一篇是讲java实现哈夫曼的。

题目:将一个字符串进行哈夫曼编码;编码过程中,会得到每个字符的编码,通过已知的每个字符的编码对之前的编码进行解码。

分析:

首先是哈夫曼编码算法,引用李泽年写的《多媒体技术教程》中对哈夫曼编码算法的描述:

Initialization: Put all symbols on a list sorted according to their frequency counts.
Repeat until the list has only one symbol left:
From the list pick two symbols with the lowest frequency counts. Form a Huffman subtree that has these two symbols as child nodes and create a parent node.
Assign the sum of the children's frequency counts to the parent and insert it into the list such that the order is maintained.
Delete the children from the list.
Assign a code word for each leaf based on the path from the root.
我的代码是基于这段算法描述实现的。实际上,我看的是中文版,但是没有找到该书的中文电子版,只好把英文版粘过来了。不过,好在英文版的也不复杂。


接下来是解码。虽然解码过程很简单,但是却是本文存在的理由。我在网上看了一些文章,都忽略一个问题:编码和解码过程中都有的东西是什么?也就是,依靠什么东西来解码?本文的答案是“每个字符的编码”,它在编码的过程中生成,和字符串编码一起传到解码端用于解码。你也可以说是“每个字符出现的次数”或者“哈夫曼树”,不管是“每个字符出现的次数”还是“哈夫曼树”,你都需要通过他们得到“每个字符的编码”之后才能进行解码。

下面是Java代码:

[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. /** 
  4.  * 哈夫曼树的节点 
  5.  * @author yuncong 
  6.  * 
  7.  */  
  8. public class Node implements Comparable{  
  9.     private Node leftChild = null;  
  10.     private Data data = null;  
  11.     private Node rightChild = null;  
  12.       
  13.     public Node getLeftChild() {  
  14.         return leftChild;  
  15.     }  
  16.     public void setLeftChild(Node leftChild) {  
  17.         this.leftChild = leftChild;  
  18.     }  
  19.     public Data getData() {  
  20.         return data;  
  21.     }  
  22.     public void setData(Data data) {  
  23.         this.data = data;  
  24.     }  
  25.     public Node getRightChild() {  
  26.         return rightChild;  
  27.     }  
  28.     public void setRightChild(Node rightChild) {  
  29.         this.rightChild = rightChild;  
  30.     }  
  31.     @Override  
  32.     public String toString() {  
  33.         return "Node [leftChild=" + leftChild + ", data=" + data  
  34.                 + ", rightChild=" + rightChild + "]";  
  35.     }  
  36.     @Override  
  37.     public int compareTo(Node o) {  
  38.         return this.data.compareTo(o.getData());  
  39.     }  
  40.       
  41. }  

[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. /** 
  4.  * Data用于存储一个字符及其出现的次数 
  5.  * @author yuncong 
  6.  * 
  7.  */  
  8. public class Data implements Comparable{  
  9.     // 字符  
  10.     private char c = 0;  
  11.     // 字符出现的次数  
  12.     private int frequency = 0;  
  13.       
  14.     public char getC() {  
  15.         return c;  
  16.     }  
  17.     public void setC(char c) {  
  18.         this.c = c;  
  19.     }  
  20.     public int getFrequency() {  
  21.         return frequency;  
  22.     }  
  23.     public void setFrequency(int frequency) {  
  24.         this.frequency = frequency;  
  25.     }  
  26.       
  27.     @Override  
  28.     public String toString() {  
  29.         return "Data [c=" + c + ", frequency=" + frequency + "]";  
  30.     }  
  31.     @Override  
  32.     public int compareTo(Data o) {  
  33.         if (this.frequency < o.getFrequency()) {  
  34.             return -1;  
  35.         } else if (this.frequency > o.getFrequency()) {  
  36.             return 1;  
  37.         } else {  
  38.             return 0;  
  39.         }  
  40.     }  
  41.       
  42.       
  43. }  

[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. import java.util.Map;  
  4.   
  5. /** 
  6.  * 对字符串编码后的结果:包括编码后的字符串和字符/编码对 
  7.  * @author yuncong 
  8.  * 
  9.  */  
  10. public class EncodeResult {  
  11.     // 字符串编码后的结果  
  12.     private String encode;  
  13.     // 字符编码对  
  14.     private Map letterCode;  
  15.     public EncodeResult(String encode, Map letterCode) {  
  16.         super();  
  17.         this.encode = encode;  
  18.         this.letterCode = letterCode;  
  19.     }  
  20.     public String getEncode() {  
  21.         return encode;  
  22.     }  
  23.     public Map getLetterCode() {  
  24.         return letterCode;  
  25.     }  
  26. }  

[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. public interface HuffmanAlgorithm {  
  4.     /** 
  5.      * 编码字符串。 
  6.      * @param str 指定的需要编码的字符串 
  7.      * @return 编码结果 
  8.      */  
  9.     public EncodeResult encode(String str);  
  10.     /** 
  11.      * 根据编码结果返回原来的字符串。 
  12.      * @param decodeResult 原来字符串的编码结果。 
  13.      * @return 解码出来的字符串。 
  14.      */  
  15.     public String decode(EncodeResult encodeResult);  
  16. }  

[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. import java.util.ArrayList;  
  4. import java.util.HashMap;  
  5. import java.util.Map;  
  6. import java.util.Set;  
  7.   
  8. import com.liyuncong.application.commontools.FileTools;  
  9.   
  10. public abstract class HuffmanAlgorithmAbstract implements HuffmanAlgorithm {  
  11.     @Override  
  12.     public EncodeResult encode(String str) {  
  13.         ArrayList letterList = toList(str);  
  14.         Node rootNode = createTree(letterList);  
  15.         Map letterCode = getLetterCode(rootNode);  
  16.         EncodeResult result = encode(letterCode, str);  
  17.         return result;  
  18.     }  
  19.       
  20.     /** 
  21.      * 把一个字符串转化为节点列表 
  22.      * @param letters 
  23.      * @return 
  24.      */  
  25.     private ArrayList toList(String letters) {  
  26.         ArrayList letterList = new ArrayList();  
  27.         Map ci = new HashMap();  
  28.         for (int i = 0; i < letters.length(); i++) {  
  29.             Character character = letters.charAt(i);  
  30.             if (!ci.keySet().contains(character)) {  
  31.                 ci.put(character, 1);  
  32.             } else {  
  33.                 Integer oldValue = ci.get(character);  
  34.                 ci.put(character, oldValue + 1);  
  35.             }  
  36.         }  
  37.         Set keys = ci.keySet();  
  38.         for (Character key : keys) {  
  39.             Node node = new Node();  
  40.             Data data = new Data();  
  41.             data.setC(key);  
  42.             data.setFrequency(ci.get(key));  
  43.             node.setData(data);  
  44.             letterList.add(node);  
  45.         }  
  46.         return letterList;  
  47.     }  
  48.       
  49.     protected abstract Node createTree(ArrayList letterList);  
  50.       
  51.     /** 
  52.      * 编码字符串。 
  53.      * @param letterCode 字符/编码对集合。 
  54.      * @param letters 指定的需要编码的字符串。 
  55.      * @return 编码结果 
  56.      */  
  57.     private EncodeResult encode(Map letterCode, String letters) {  
  58.         StringBuilder encode = new StringBuilder();  
  59.         for (int i = 0, length = letters.length(); i < length; i++) {  
  60.             Character character = letters.charAt(i);  
  61.             encode.append(letterCode.get(character));  
  62.         }  
  63.         EncodeResult result = new EncodeResult(encode.toString(), letterCode);  
  64.         return result;  
  65.     }  
  66.       
  67.     /** 
  68.      * 获得所有字符编码对 
  69.      *  
  70.      * @param rootNode哈夫曼树的根节点 
  71.      * @return 所有字符编码对 
  72.      */  
  73.     private Map getLetterCode(Node rootNode) {  
  74.         Map letterCode = new HashMap();  
  75.         // 处理只有一个节点的情况  
  76.         if (rootNode.getLeftChild() == null && rootNode.getRightChild() == null) {  
  77.             letterCode.put(rootNode.getData().getC(), "1");  
  78.             return letterCode;  
  79.   
  80.         }  
  81.         getLetterCode(rootNode, "", letterCode);  
  82.         return letterCode;  
  83.     }  
  84.   
  85.     /** 
  86.      * 先序遍历哈夫曼树,获得所有字符编码对。 
  87.      *  
  88.      * @param rooNode 哈夫曼树根结点 
  89.      * @param suffix 编码前缀,也就是编码这个字符时,之前路径上的所有编码 
  90.      * @param letterCode 用于保存字符编码结果 
  91.      */  
  92.     private void getLetterCode(Node rooNode, String suffix,  
  93.             Map letterCode) {  
  94.         if (rooNode != null) {  
  95.             if (rooNode.getLeftChild() == null  
  96.                     && rooNode.getRightChild() == null) {  
  97.                 Character character = rooNode.getData().getC();  
  98.                 letterCode.put(character, suffix);  
  99.   
  100.             }  
  101.             getLetterCode(rooNode.getLeftChild(), suffix + "0", letterCode);  
  102.             getLetterCode(rooNode.getRightChild(), suffix + "1", letterCode);  
  103.   
  104.         }  
  105.     }  
  106.       
  107.     public String decode(EncodeResult decodeResult) {  
  108.         // 解码得到的字符串  
  109.         StringBuffer decodeStr = new StringBuffer();  
  110.         // 获得解码器  
  111.         Map decodeMap = getDecoder(decodeResult  
  112.                 .getLetterCode());  
  113.         // 解码器键集合  
  114.         Set keys = decodeMap.keySet();  
  115.         // 待解码的(被编码的)字符串  
  116.         String encode = decodeResult.getEncode();  
  117.         // 从最短的开始匹配之所以能够成功,是因为哈夫曼编码的唯一前缀性质  
  118.         // 临时的可能的键值  
  119.         String temp = "";  
  120.         // 改变temp值大小的游标  
  121.         int i = 1;  
  122.         while (encode.length() > 0) {  
  123.             temp = encode.substring(0, i);  
  124.             if (keys.contains(temp)) {  
  125.                 Character character = decodeMap.get(temp);  
  126.                 decodeStr.append(character);  
  127.                 encode = encode.substring(i);  
  128.                 i = 1;  
  129.             } else {  
  130.                 i++;  
  131.             }  
  132.         }  
  133.         return decodeStr.toString();  
  134.     }  
  135.   
  136.     /** 
  137.      * 获得解码器,也就是通过字母/编码对得到编码/字符对。 
  138.      *  
  139.      * @param letterCode 
  140.      * @return 
  141.      */  
  142.     private Map getDecoder(Map letterCode) {  
  143.         Map decodeMap = new HashMap();  
  144.         Set keys = letterCode.keySet();  
  145.         for (Character key : keys) {  
  146.             String value = letterCode.get(key);  
  147.             decodeMap.put(value, key);  
  148.         }  
  149.         return decodeMap;  
  150.     }  
  151. }  
[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. import java.util.ArrayList;  
  4. import java.util.HashMap;  
  5. import java.util.Map;  
  6. import java.util.Set;  
  7.   
  8. /** 
  9.  * 算法实现参考《多媒体技术教程》 
  10.  * @author yuncong 
  11.  * 
  12.  */  
  13. public class HuffmanAlgorithmImpl1 extends HuffmanAlgorithmAbstract {  
  14.       
  15.     /* 
  16.      * 创建哈夫曼树; 丢失了letterList中的数据,深拷贝letterList是需要完善的地方 
  17.      */  
  18.     @Override  
  19.     protected Node createTree(ArrayList letterList) {  
  20.         init(letterList);  
  21.         while (letterList.size() != 1) {  
  22.             int size = letterList.size();  
  23.             // 小的节点放在右边(眼睛看到的左边)  
  24.             Node nodeLeft = letterList.get(size - 1);  
  25.             Node nodeRight = letterList.get(size - 2);  
  26.             Node nodeParent = new Node();  
  27.             nodeParent.setLeftChild(nodeLeft);  
  28.             nodeParent.setRightChild(nodeRight);  
  29.             Data data = new Data();  
  30.             data.setFrequency(nodeRight.getData().getFrequency()  
  31.                     + nodeLeft.getData().getFrequency());  
  32.             nodeParent.setData(data);  
  33.             letterList.set(size - 2, nodeParent);  
  34.             letterList.remove(size - 1);  
  35.             sort(letterList);  
  36.   
  37.         }  
  38.         Node rootNode = letterList.get(0);  
  39.         return rootNode;  
  40.     }  
  41.       
  42.     /** 
  43.      * 初始化 让节点列表有序 
  44.      */  
  45.     private void init(ArrayList letterList) {  
  46.         sort(letterList);  
  47.     }  
  48.   
  49.     /** 
  50.      * 冒泡排序,把小的放在最后 
  51.      */  
  52.     private void sort(ArrayList letterList) {  
  53.         int size = letterList.size();  
  54.         // 处理只有一个元素的情况,也就是说,不需要排序  
  55.         if (size == 1) {  
  56.             return;  
  57.         }  
  58.         for (int i = 0; i < size; i++) {  
  59.             for (int j = 0; j < size - 1 - i; j++) {  
  60.                 if (letterList.get(j).getData().getFrequency() < letterList  
  61.                         .get(j + 1).getData().getFrequency()) {  
  62.                     Node tempNode = letterList.get(j);  
  63.                     letterList.set(j, letterList.get(j + 1));  
  64.                     letterList.set(j + 1, tempNode);  
  65.   
  66.                 }  
  67.             }  
  68.         }  
  69.     }  
  70.   
  71. }  


[java]  view plain  copy
  1. package com.liyuncong.algorithms.algorithms_huffman;  
  2.   
  3. import static org.junit.Assert.*;  
  4.   
  5. import org.junit.Test;  
  6.   
  7. public class HuffmanAlgorithmImpl1Test {  
  8.   
  9.     @Test  
  10.     public void testEncodeString() {  
  11.         HuffmanAlgorithmImpl1 huffmanImpl1 = new HuffmanAlgorithmImpl1();  
  12.         EncodeResult result = huffmanImpl1.encode("abcdda");  
  13.         System.out.println(result.getEncode());  
  14.     }  
  15.   
  16.     @Test  
  17.     public void testDecode() {  
  18.         HuffmanAlgorithmImpl1 huffmanImpl1 = new HuffmanAlgorithmImpl1();  
  19.         EncodeResult result = huffmanImpl1.encode("abcdda");  
  20.         String decode = huffmanImpl1.decode(result);  
  21.         System.out.println(decode);  
  22.     }  
  23.   
  24.   
  25. }  
原文地址:http://blog.csdn.net/l294265421/article/details/44778989

你可能感兴趣的:(javaee)