JAVA中对jar文件或zip文件解压的时候,可以使用JDK内置的API:JarFile和ZipFile,在windows下解压这2种格式文件的时候,经常报以下错误:
Exception in thread "main" java.lang.IllegalArgumentException: MALFORMED at java.util.zip.ZipCoder.toString(ZipCoder.java:58) at java.util.zip.ZipFile.getZipEntry(ZipFile.java:531) at java.util.zip.ZipFile.access$900(ZipFile.java:56) at java.util.zip.ZipFile$1.nextElement(ZipFile.java:513) at java.util.zip.ZipFile$1.nextElement(ZipFile.java:483)
出现这种问题有2种可能:
1、拿到的zip或jar本身就是损坏的,这个时候可以使用winRAR等软件进行解压。
如果没有报错,那么可以证明:拿到的压缩文件是没有问题的。
2、字符集问题,zip或jar中含有中文的文件名或文件路径。
//windows下自己用winRAR压缩文件 File file = new File("C:/Users/aty/Desktop/demo.zip"); ZipFile zip = new ZipFile(file); Enumeration<? extends ZipEntry> entrys = zip.entries(); while (entrys.hasMoreElements()) { ZipEntry entry = entrys.nextElement(); System.out.println(entry.getName()); } zip.close();
在windows下,将名称含有中文的文件或目录,用winRAR制作一个demo.zip文件,运行上面代码会发现抛异常。这是因为中文windows环境下,操作系统默认的字符集是GBK,但是ZipFile只能识别UTF-8格式。所以当zip文件中含有中文(但不是UTF-8编码)的时候,java的 ZipFile就会报错。
这个问题在JDK1.7及其之后,解决这个问题是很简单的。JDK提供了构造函数,允许我们指定zip文件的字符集。
public ZipFile(String name, Charset charset) throws IOException
如果在JDK1.6或之前,那么可以使用ant.jar中提供的org.apache.tools.zip.ZipFile,使用方式跟JDK1.7中的ZipFile很相似。
可以看到JDK1.7中ZipFile允许我们指定字符集,但是JarFile这个类还是固定使用UTF-8格式。