如果你有压缩包的密码忘记了,并且压缩包的加密算法采用的是ZipCrypto,并且压缩参数如下图所示:
那么你就可以使用本文中的方法进行破解。
压缩包的加密,是根据输入的密码进行运算加密,输入不同的密码,加密后的结果就是不同的二进制流。所以在进行解密的时候,不同的密码会解密出不同的结果,但是只有一种结果是你想要的正确的结果。
假设组成密码的字符总共有 a 个,密码是1 ~ n位,那么可以组合出 S 种不同的密码,一个字符占一个字节,所有密码的所有字符加在一起总共有 Q 个字节。下面分别给出 S 和 Q 的计算公式:
S = a 1 + a 2 + a 3 + a 4 + . . . . . . + a n (1) S = a^1+a^2+a^3+a^4+... ...+a^n\tag{1} S=a1+a2+a3+a4+......+an(1)
a S = a 2 + a 3 + a 4 + . . . . . . + a n + a n + 1 (2) aS=a^2+a^3+a^4+... ...+a^n+a^{n+1}\tag{2} aS=a2+a3+a4+......+an+an+1(2)
(1)式减去(2)式得:
( 1 − a ) S = a 1 − a n + 1 (1-a)S=a^1-a^{n+1} (1−a)S=a1−an+1
最后可以化简得到:
S = a ( 1 − a n ) 1 − a . S=\dfrac{a(1-a^n)}{1-a}. S=1−aa(1−an).
Q = 1 ⋅ a 1 + 2 ⋅ a 2 + 3 ⋅ a 3 + . . . . . . + n ⋅ a n (3) Q=1·a^1+2·a^2+3·a^3+... ... + n·a^n\tag{3} Q=1⋅a1+2⋅a2+3⋅a3+......+n⋅an(3)
a Q = 1 ⋅ a 2 + 2 ⋅ a 3 + 3 ⋅ a 4 + . . . . . . + ( n − 1 ) ⋅ a n + n ⋅ a n + 1 (4) aQ=1·a^2+2·a^3+3·a^4+... ...+(n-1)·a^n+n·a^{n+1}\tag{4} aQ=1⋅a2+2⋅a3+3⋅a4+......+(n−1)⋅an+n⋅an+1(4)
(3)式减去(4)式得:
( 1 − a ) Q = a 1 + a 2 + a 3 + a 4 + . . . . . . + a n − n ⋅ a n + 1 (1-a)Q=a^1+a^2+a^3+a^4+... ...+a^n-n·a^{n+1} (1−a)Q=a1+a2+a3+a4+......+an−n⋅an+1
化简得:
Q = a ( 1 − a n ) ( 1 − a ) 2 + n ⋅ a n + 1 a − 1 . Q=\dfrac{a(1-a^n)}{(1-a)^2}+\dfrac{n·a^{n+1}}{a-1}. Q=(1−a)2a(1−an)+a−1n⋅an+1.
一开始,我的思路是先写一个程序,这个程序把所有的密码组合出来,写入一个文件,然后再写一个程序,这个程序负责把写入的密码读取出来,再逐个暴力破解。但是后来发现这种思路存在几个问题,如果密码的组合可能性太多的时候,那么存取所有密码的这个文件将会达到几十个G(甚至更大)。压缩包的密码位数可以是1 ~ 127位的(超过127位的密码也有)。以最大位数127位为例,假如不知道密码是多少位,那么可以组合出:
9 4 1 + 9 4 2 + 9 4 3 + . . . . . . + 9 4 126 + 9 4 127 94^1+94^2+94^3+... ... + 94^{126}+94^{127} 941+942+943+......+94126+94127
种不同的密码组合。使用上面的式子计算一下,就可以知道总共有:39073499766929905093170936199210360403225359398866973176589007276420630179610064715271048101086598784117989282816367722389837036292113256007435625512903036280893835514194448335273218252856958007222866912360893842268293858285256762926406241457713184768 种不同的密码。
如果将所有的密码组合写入文件,不算回车换行符号,那么这个文件将会占 4961914325241313777553199490046598363526519239925145287832966868945419472665422521762910503472996114196429684959005740369797942759811562831081763117671397554605682022967601468185686939482979425062618339967434564286481867349313821628002924237784812093440 个字节。
并且,如果正确密码是最后一个,那么将要循环到最后一个密码才能破解成功,这样将会很耗费时间。所以,我采用了随机密码暴力破解。
下面是代码:
import zipfile
import os
import numpy as np
pwdCharset = ['`', '~', '!', '@', '#', '$', '%', '^', '&', '*', '(', ')', '-', '_', '=', '+', '[', ']', '{', '}', ';', ':', "'", '"', '\\', '|', ',', '<', '.', '>', '/', '?', 'a', 'A', 'b', 'B', 'c', 'C', 'd', 'D', 'e', 'E', 'f', 'F', 'g', 'G', 'h', 'H', 'i', 'I', 'j', 'J', 'k', 'K', 'l', 'L', 'm', 'M', 'n', 'N', 'o', 'O', 'p', 'P', 'q', 'Q', 'r', 'R', 's', 'S', 't', 'T', 'u', 'U', 'v', 'V', 'w', 'W', 'x', 'X', 'y', 'Y', 'z', 'Z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
# 94\
CharsetInput = []
def gPwd(chST, lgth, rgth):
while True:
pl = int(np.random.random() * 100)
if pl >= lgth and pl <= rgth:
break
pwd = ""
chStLen = len(chST)
for i in range(0, pl):
while True:
idx = int(np.random.random() * 100)
if idx >= 0 and idx < chStLen:
break
pwd += chST[idx]
return pwd
def dcryp(fileName, lLen, rLen, chST):
fp = zipfile.ZipFile(fileName)
count = 0
while True:
pwd = gPwd(chST, lLen, rLen)
count += 1
try:
for file in fp.namelist():
fp.extract(file, pwd=pwd.encode())
os.rename(file, file.encode('cp437').decode('gbk'))
print("%d Success! The password is %s" % (count, pwd))
break
except:
print("%d %s no" % (count, pwd))
if __name__ == "__main__":
fileName = input("请输入要破解的压缩包文件名:")
choose = input("按1选择暴力破解。\n按2选择指定条件破解\n")
if "1" == choose:
leftLen = int(input("确定密码的长度范围:\n请输入密码的最小长度:"))
rightLen = int(input("请输入密码的最大长度:"))
dcryp(fileName, leftLen, rightLen, pwdCharset)
elif "2" == choose:
charSt = input("请输入密码中可能包含的字符:\n")
for i in charSt:
CharsetInput.append(i)
leftLen = int(input("确定密码的长度范围:\n请输入密码的最小长度:"))
rightLen = int(input("请输入密码的最大长度:"))
dcryp(fileName, leftLen, rightLen, CharsetInput)
else:
print("无效输入!")
这里选用的是4位的定长密码,尝试了10515次,用了不到10秒钟的到结果。
4位定长密码,如果不指定字符集,用所有可能的字符集暴力随机破解,总共有78074896种不同的密码组合,一共尝试了13478113次,将会用大概20多分钟的时间。
密码越长,且可能的字符越多,则破解的时间越长。
针对长而复杂的密码,如果加密的内容很重要,一定要破解出来的话,可以采用分布式破解,即一台主机通过网络将破解内容分发给一个计算机集群,集群中的每一台主机同时运行多个破解进程,并定期向控制主机发送心跳信号,反馈破解信息,这样可以大大缩短破解时间。