unzip解压缩含中文文件名zip包时出现乱码的解决办法

症状:

使用unzip解压缩在ms windows平台上用winzip压缩的zip文件,如果其中含有中文文件名,结果会出现乱码,而且用convmv转换文件名编码方式也无法解决问题。


分析:

参考这篇文章 让Unzip正确解压其中包含中文文件名的Winzip压缩包 ,原因是unzip试图将zip文件中用 oem(ibm-dos) codepage 编码的文件名转换成自己的内部编码。可惜unzip只能转换极少数几种codepage,中文的 cp936 不在其列。


解决办法:

参考文章的作者廖中熙将 unzpriv.h 中 Ext_ASCII_TO_Native 宏中的判断去掉,不管是否为oem codepage,全部用 _ISO_INTERN((string))来转换到内部编码。

我观察到unzip源代码这段开始的地方有判断 #ifndef Ext_ASCII_TO_Native ,这样问题似乎更简单了,不用改源代码,只需在make时定义 Ext_ASCII_TO_Native 即可,这样 Ext_ASCII_TO_Native 实际为一个空的宏,不进行任何转换操作。比如,使用下面的方法编译

$make -DExt_ASCII_TO_Native

或者在bash执行下面两行

$export LOCAL_UNZIP=-DExt_ASCII_TO_Native
$make

结果:

unzip解压缩含中文文件名zip包是出现乱码的问题解决!

 

你可能感兴趣的:(windows,ext,dos,IBM,bash)