简介:
ZIP文件格式是一种数据压缩和文档储存的文件格式,原名Deflate,发明者为菲尔·卡茨(Phil Katz),他于1989年1月公布了该格式的资料。ZIP通常使用后缀名“.zip”,它的MIME格式为application/zip。当前,ZIP格式属于几种主流的压缩格式之一,其竞争者包括RAR格式以及开放源码的7z格式。从性能上比较,RAR及7z格式较ZIP格式压缩率较高,而7-Zip由于提供了免费的压缩工具而逐渐在更多的领域得到应用。Microsoft从Windows ME操作系统开始内置对zip格式的支持,即使用户的计算机上没有安装解压缩软件,也能打开和制作zip格式的压缩文件,OS X和流行的Linux操作系统也对zip格式提供了类似的支持。因此如果在网络上传播和分发文件,zip格式往往是最常用的选择。
ZIP是一种相当简单的分别压缩每个文件的存档格式。分别压缩文件允许不必读取另外的数据而检索独立的文件;理论上,这种格式允许对不同的文件使用不同的算法。不管用何种方法,对这种格式的一个告诫是对于包含很多小文件的时候,存档会明显的比压缩成一个独立的文件(在类Unix系统中一个经典的例子是普通的tar.gz存档是由一个使用gzip压缩的TAR存档组成)要大。
首先是需要创建一个.zip后缀名的压缩包,然后给这个zip压缩包设置一个密码。
注意这里要点击ZIP传统加密。
把这个文件放入到pycharm里面。
from zipfile import ZipFile
import os
def passwd(path):
# 获取文件的后缀名
suffix_name = os.path.splitext(path)[-1][1:]
print(suffix_name)
if __name__ == '__main__':
passwd("D:\系统默认\桌面\python数据分析\python爬虫\zip\二叉树.zip")
运行结果:
from zipfile import ZipFile
import os
def passwd(path):
# 获取文件的后缀名
suffix_name = os.path.splitext(path)[-1][1:]
# print(suffix_name)
# 如果是zip文件
if suffix_name == 'zip':
# 开始读zip文件
with ZipFile(path, 'r') as zip:
# 解压到指定文件目录下
zip.extractall("D:\系统默认\桌面\python数据分析\python爬虫\\target")
if __name__ == '__main__':
passwd("D:\系统默认\桌面\python数据分析\python爬虫\zip\二叉树.zip")
运行结果:
对于没有密码的解压,我们写到这一步就可以了,如果设置了有密码,然后了我们就会发现,这个会报错。
def create_pwd(words):
# 通过导入这包来设置枚举序列
import itertools as its
# 设置基础需要枚举的字符集
# 这个base的意思就是把words集合的字符取repeat次组合
# 打印出来
base = its.product(words, repeat=2)
for i in base:
print(''.join(i))
运行结果
完整代码
from zipfile import ZipFile
import os
def passwd(path, pwd):
# 获取文件的后缀名
suffix_name = os.path.splitext(path)[-1][1:]
# print(suffix_name)
# 如果是zip文件
if suffix_name == 'zip':
# 开始读zip文件
with ZipFile(path, 'r') as zip:
# print("当前尝试的密码是:%s"%(pwd))
# 解压到指定文件目录下
try:
# print(pwd.encode('utf-8'))
zip.extractall("D:\系统默认\桌面\python数据分析\python爬虫\\target", pwd=pwd.encode('utf-8'))
print("解压成功,密码是:%s"%(pwd))
return True
except Exception as e: # 添加一个异常处理
pass
def create_pwd(words):
# 通过导入这包来设置枚举序列
import itertools as its
# 设置基础需要枚举的字符集
# 这个base的意思就是把words集合的字符取repeat次组合
# 打印出来
base = its.product(words, repeat=6)
# 一般需要把这个打印函数注释 因为这个函数运行很消耗时间的
for i in base:
# print(''.join(i))
yield ''.join(i) # 把这个函数制作成一个迭代器
if __name__ == '__main__':
words = '123456789'
dir = 'D:\系统默认\桌面\python数据分析\python爬虫\zip\二叉树.zip'
for p in create_pwd(words):
flag = passwd(dir, p)
if flag == True:
break
运行结果:
这个结果的命名很奇怪,但是问题不大只要可以解压,后面会讲解一下,比较难的解压方法,涉及到算法。
######学习资源推荐
零基础Python学习资源介绍
Python学习路线汇总
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(学习教程文末领取哈)
Python必备开发工具
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
Python学习视频600合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
100道Python练习题
检查学习结果。
面试刷题
上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码输入“领取资料” 即可领取。