本文实例讲述了Python遍历zip文件输出名称时出现乱码问题的解决方法。分享给大家供大家参考。具体如下:
windows中使用python2.7遍历zip文件之后输出文件名等信息,console打印的中文及一些标点出现乱码。查了一下网上说的windows的编码为cp936,print()函数交给系统处理打印,所以要提前编码成windows能够识别的编码。
这种print的乱码也会出现在形如print(mylist)中(mylist是python的list类型变量,print(mylist[2])则不会乱码,奇怪)
代码如下:(.py文件中在文件头先加 # -- coding: UTF-8 –-)
import zipfile
def listzipfilesinfo(path):
z=zipfile.ZipFile(path,'r')
try:
for filename in z.namelist():
bytes=z.read(filename)
print('File:%s Size:%s'%(unicode(filename, 'cp936').decode('utf-8'),len(bytes)))
finally:
z.close()
注:decode可以去掉
对于中文问题,如果上面的代码还不足以解决你的问题,我们还可以尝试使用如下方法来进行解决:
import zipfile
def listzipfilesinfo(path,toPath):
"""
解压
:param path:zip文件路径
:param toPath:解压至的文件夹路径
"""
with zipfile.ZipFile(path) as zipTools:
name_list = [unicode(item, 'cp936').decode('utf-8') for item in zipTools.name_list()]
for index,value in enumerate(zipTools.namelist()):
path = os.path.join(toPath, os.path.basename(name_list[index]))
data = zipTools.read(value)
with open(path, "w") as f:
f.write(data)
希望本文所述对大家的Python程序设计有所帮助。
原文地址:http://www.jb51.net/article/63719.htm