JAVA 实现文件(字符串)压缩与解压

1.引言

最近在做项目中,平台提供一个http服务给其他系统调用,然后我接收到其他系统的json格式的报文后去解析,然后用拿到的数据去调用corba服务,我再把corba的返回值封装完成json字符串返回给外部系统。遇到一个接口去调用corba服务,然后corba返回的数据经过封装后字符串的长度达到7M左右,导致http客户端无法正常的接收完所有的数据。你可能会说这个接口设计的不合理,为什么不增加查询条件把查询条件范围缩小一点?但是,这个不是本节要讨论的内容,主要是因为corba服务已经发布用了很久且不在此次项目改造范围之内,再者这个corba服务已经上线用了N久,轻易的改变可能会导致未知的错误。签于此,我想到可以把json格式的字符串给压缩,然后客户端再解压。(一是字符串的压缩比例比较的高,二是字符串的压缩和解压实现起来也比较简单)。虽然,最后没有用到字符串的压缩和解压的方式,而是修改客户端(1.http客户端进一步精确查询条件  2.读取返回数据流采用循环读取的方式)来解决此问题,我还是把字符串的压缩和解压做一下简单的记录。

2.关于压缩与解压

压缩算法有多种,我说知道和接触有java I/O自带的zip和gzip两种方式。

本节主要来简单介绍一下在系统交互之间遇到大容量的字符串数据交互时,采用一端压缩,另一端再解压的方式来发送和接收数据。

关于此次的压缩和解压用到的主要就是GZIPOutputStream和GZIPInputStream类,此类的相关介绍在JDK中有详细的介绍,这里就不再累述了。

 

3.代码如下:

 

[html]  view plain  copy
  1. ZipStrUtil.java   
  2.  package gzip;  
  3.    
  4.  import java.io.ByteArrayInputStream;  
  5.  import java.io.ByteArrayOutputStream;  
  6.  import java.io.IOException;  
  7.  import java.util.zip.GZIPInputStream;  
  8.  import java.util.zip.GZIPOutputStream;  
  9.    
  10.  /**  
  11.   *   
  12.   *Module:          ZipUtil.java  
  13.   *Description:    对字符串的压缩及解压  
  14.   *Company:         
  15.   *Author:           pantp  
  16.   *Date:             May 6, 2012  
  17.   */  
  18.  public class ZipStrUtil {  
  19.    
  20.      public static void main(String[] args) throws IOException {  
  21.          // 字符串超过一定的长度  
  22.          String str = "ABCdef123中文~!@#$%^&*()_+{};/1111111111111111111111111AAAAAAAAAAAJDLFJDLFJDLFJLDFFFFJEIIIIIIIIIIFJJJJJJJJJJJJALLLLLLLLLLLLLLLLLLLLLL" +  
  23.                  "LLppppppppppppppppppppppppppppppppppppppppp===========================------------------------------iiiiiiiiiiiiiiiiiiiiiii";  
  24.          System.out.println("\n原始的字符串为------->" + str);  
  25.          float len0=str.length();  
  26.          System.out.println("原始的字符串长度为------->"+len0);  
  27.    
  28.          String ys = compress(str);  
  29.          System.out.println("\n压缩后的字符串为----->" + ys);  
  30.          float len1=ys.length();  
  31.          System.out.println("压缩后的字符串长度为----->" + len1);  
  32.    
  33.          String jy = unCompress(ys);  
  34.          System.out.println("\n解压缩后的字符串为--->" + jy);  
  35.          System.out.println("解压缩后的字符串长度为--->"+jy.length());  
  36.            
  37.          System.out.println("\n压缩比例为"+len1/len0);  
  38.            
  39.          //判断  
  40.          if(str.equals(jy)){  
  41.              System.out.println("先压缩再解压以后字符串和原来的是一模一样的");  
  42.          }  
  43.      }  
  44.    
  45.      /**  
  46.       * 字符串的压缩  
  47.       *   
  48.       * @param str  
  49.       *            待压缩的字符串  
  50.       * @return    返回压缩后的字符串  
  51.       * @throws IOException  
  52.       */  
  53.      public static String compress(String str) throws IOException {  
  54.          if (null == str || str.length() <= 0) {  
  55.              return str;  
  56.          }  
  57.          // 创建一个新的 byte 数组输出流  
  58.          ByteArrayOutputStream out = new ByteArrayOutputStream();  
  59.          // 使用默认缓冲区大小创建新的输出流  
  60.          GZIPOutputStream gzip = new GZIPOutputStream(out);  
  61.          // 将 b.length 个字节写入此输出流  
  62.          gzip.write(str.getBytes());  
  63.          gzip.close();  
  64.          // 使用指定的 charsetName,通过解码字节将缓冲区内容转换为字符串  
  65.          return out.toString("ISO-8859-1");  
  66.      }  
  67.        
  68.      /**  
  69.       * 字符串的解压  
  70.       *   
  71.       * @param str  
  72.       *            对字符串解压  
  73.       * @return    返回解压缩后的字符串  
  74.       * @throws IOException  
  75.       */  
  76.      public static String unCompress(String str) throws IOException {  
  77.          if (null == str || str.length() <= 0) {  
  78.              return str;  
  79.          }  
  80.          // 创建一个新的 byte 数组输出流  
  81.          ByteArrayOutputStream out = new ByteArrayOutputStream();  
  82.          // 创建一个 ByteArrayInputStream,使用 buf 作为其缓冲区数组  
  83.          ByteArrayInputStream in = new ByteArrayInputStream(str  
  84.                  .getBytes("ISO-8859-1"));  
  85.          // 使用默认缓冲区大小创建新的输入流  
  86.          GZIPInputStream gzip = new GZIPInputStream(in);  
  87.          byte[] buffer = new byte[256];  
  88.          int n = 0;  
  89.          while ((n = gzip.read(buffer)) >= 0) {// 将未压缩数据读入字节数组  
  90.              // 将指定 byte 数组中从偏移量 off 开始的 len 个字节写入此 byte数组输出流  
  91.              out.write(buffer, 0, n);  
  92.          }  
  93.          // 使用指定的 charsetName,通过解码字节将缓冲区内容转换为字符串  
  94.          return out.toString("GBK");  
  95.      }  
  96.    
  97.  }  
[html]  view plain  copy
 
  1. ZipStrUtil.java   
  2.  package gzip;  
  3.    
  4.  import java.io.ByteArrayInputStream;  
  5.  import java.io.ByteArrayOutputStream;  
  6.  import java.io.IOException;  
  7.  import java.util.zip.GZIPInputStream;  
  8.  import java.util.zip.GZIPOutputStream;  
  9.    
  10.  /**  
  11.   *   
  12.   *Module:          ZipUtil.java  
  13.   *Description:    对字符串的压缩及解压  
  14.   *Company:         
  15.   *Author:           pantp  
  16.   *Date:             May 6, 2012  
  17.   */  
  18.  public class ZipStrUtil {  
  19.    
  20.      public static void main(String[] args) throws IOException {  
  21.          // 字符串超过一定的长度  
  22.          String str = "ABCdef123中文~!@#$%^&*()_+{};/1111111111111111111111111AAAAAAAAAAAJDLFJDLFJDLFJLDFFFFJEIIIIIIIIIIFJJJJJJJJJJJJALLLLLLLLLLLLLLLLLLLLLL" +  
  23.                  "LLppppppppppppppppppppppppppppppppppppppppp===========================------------------------------iiiiiiiiiiiiiiiiiiiiiii";  
  24.          System.out.println("\n原始的字符串为------->" + str);  
  25.          float len0=str.length();  
  26.          System.out.println("原始的字符串长度为------->"+len0);  
  27.    
  28.          String ys = compress(str);  
  29.          System.out.println("\n压缩后的字符串为----->" + ys);  
  30.          float len1=ys.length();  
  31.          System.out.println("压缩后的字符串长度为----->" + len1);  
  32.    
  33.          String jy = unCompress(ys);  
  34.          System.out.println("\n解压缩后的字符串为--->" + jy);  
  35.          System.out.println("解压缩后的字符串长度为--->"+jy.length());  
  36.            
  37.          System.out.println("\n压缩比例为"+len1/len0);  
  38.            
  39.          //判断  
  40.          if(str.equals(jy)){  
  41.              System.out.println("先压缩再解压以后字符串和原来的是一模一样的");  
  42.          }  
  43.      }  
  44.    
  45.      /**  
  46.       * 字符串的压缩  
  47.       *   
  48.       * @param str  
  49.       *            待压缩的字符串  
  50.       * @return    返回压缩后的字符串  
  51.       * @throws IOException  
  52.       */  
  53.      public static String compress(String str) throws IOException {  
  54.          if (null == str || str.length() <= 0) {  
  55.              return str;  
  56.          }  
  57.          // 创建一个新的 byte 数组输出流  
  58.          ByteArrayOutputStream out = new ByteArrayOutputStream();  
  59.          // 使用默认缓冲区大小创建新的输出流  
  60.          GZIPOutputStream gzip = new GZIPOutputStream(out);  
  61.          // 将 b.length 个字节写入此输出流  
  62.          gzip.write(str.getBytes());  
  63.          gzip.close();  
  64.          // 使用指定的 charsetName,通过解码字节将缓冲区内容转换为字符串  
  65.          return out.toString("ISO-8859-1");  
  66.      }  
  67.        
  68.      /**  
  69.       * 字符串的解压  
  70.       *   
  71.       * @param str  
  72.       *            对字符串解压  
  73.       * @return    返回解压缩后的字符串  
  74.       * @throws IOException  
  75.       */  
  76.      public static String unCompress(String str) throws IOException {  
  77.          if (null == str || str.length() <= 0) {  
  78.              return str;  
  79.          }  
  80.          // 创建一个新的 byte 数组输出流  
  81.          ByteArrayOutputStream out = new ByteArrayOutputStream();  
  82.          // 创建一个 ByteArrayInputStream,使用 buf 作为其缓冲区数组  
  83.          ByteArrayInputStream in = new ByteArrayInputStream(str  
  84.                  .getBytes("ISO-8859-1"));  
  85.          // 使用默认缓冲区大小创建新的输入流  
  86.          GZIPInputStream gzip = new GZIPInputStream(in);  
  87.          byte[] buffer = new byte[256];  
  88.          int n = 0;  
  89.          while ((n = gzip.read(buffer)) >= 0) {// 将未压缩数据读入字节数组  
  90.              // 将指定 byte 数组中从偏移量 off 开始的 len 个字节写入此 byte数组输出流  
  91.              out.write(buffer, 0, n);  
  92.          }  
  93.          // 使用指定的 charsetName,通过解码字节将缓冲区内容转换为字符串  
  94.          return out.toString("GBK");  
  95.      }  
  96.    
  97.  }  

 


说明

字符串长度很小的时候,测试时你会发现压缩后的长度竟然变长了,字符串必须达到一定长度,压缩比例就可以明显看到很大。

你可能感兴趣的:(JAVA)