Python-zipfile解压中文问题

本文实例讲述了Python遍历zip文件输出名称时出现乱码问题的解决方法。分享给大家供大家参考。具体如下:

windows中使用python2.7遍历zip文件之后输出文件名等信息,console打印的中文及一些标点出现乱码。查了一下网上说的windows的编码为cp936,print()函数交给系统处理打印,所以要提前编码成windows能够识别的编码。
这种print的乱码也会出现在形如print(mylist)中(mylist是python的list类型变量,print(mylist[2])则不会乱码,奇怪)
代码如下:(.py文件中在文件头先加 # -- coding: UTF-8 –-)

import zipfile
def listzipfilesinfo(path):
  z=zipfile.ZipFile(path,'r')
  try:
    for filename in z.namelist():
      bytes=z.read(filename)
      print('File:%s Size:%s'%(unicode(filename, 'cp936').decode('utf-8'),len(bytes)))
  finally:
    z.close()

注:decode可以去掉

对于中文问题,如果上面的代码还不足以解决你的问题,我们还可以尝试使用如下方法来进行解决:

import zipfile
def listzipfilesinfo(path,toPath):
    """
    解压
    :param path:zip文件路径
    :param toPath:解压至的文件夹路径
    """
    with zipfile.ZipFile(path) as zipTools:
        name_list = [unicode(item, 'cp936').decode('utf-8') for item in zipTools.name_list()]
        for index,value in enumerate(zipTools.namelist()):
            path = os.path.join(toPath, os.path.basename(name_list[index]))
            data = zipTools.read(value)
            with open(path, "w") as f:
                f.write(data)

希望本文所述对大家的Python程序设计有所帮助。

原文地址:http://www.jb51.net/article/63719.htm

你可能感兴趣的:(python)