整理资料时发现几个 zip 文件的密码忘记了,于是尝试用python暴力破解
首先是读取和解压zip文件,使用 zipfile 库
import zipfile
z = zipfile.ZipFile(r'./file.zip')
z.extractall(pwd=password.encode('utf-8'))
定义一个密码元字符串,每次从里面取出一些字符,比如:
meta_str = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
随机密码
使用 random.sample 生成指定长度的密码,然后出现过的密码放入一个 set
choiced_set = set()
rand_str = ''.join(random.sample(meta_str, 4))
if rand_str not in choiced_set:
choiced_set.add(rand_str)
为了不断的产生密码并尝试解压,此处应该有循环,那么将尝试解压和生成密码封闭为函数:
import zipfile
import random
meta_str = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
choiced_set = set()
def guess(z, password):
try:
z.extractall(pwd=password.encode('utf-8'))
print('guessed pwd: {}'.format(password))
return True
except Exception:
print('invalid password [{}]'.format(password))
return False
def main():
z = zipfile.ZipFile(r'./file.zip')
while True:
rand_str = ''.join(random.sample(meta_str, 4))
if rand_str not in choiced_set:
choiced_set.add(rand_str)
if guess(z, rand_str):
raise Exception('found')
此方法代码里固定写了只支持4个字符长度,若密码不是4个字符,则会无止境的循环下去,显然不科学。
为了支持n位密码字符,需对代码稍加修改:
- 增加n位字符, for x in range(n) 可以解决
- n位密码长度的中止条件
密码个数
由于将生成的密码全部放入set,所以只需要判断set的长度,就知道当前生成了多少密码。
而密码字符可以重复,所以'abcd' 可生成的2位密码有:
'aa', 'ab', 'ac', 'ad',
'ba', 'bb', 'bc', 'bd',
'ca', 'cb', 'cc', 'cd',
'da', 'db', 'dc', 'dd,
相当于对字符串'abcd' 和 'abcd' 作笛卡尔积,那么一共是 len('abcd') * len('abcd') = 16 个密码,
所以n位密码的个数就是 len(meta_str) ** n
random.sample 不支持重复字符,替换为 numpy.random.choice(sq, n, replace=True)
引入 numpy 并修改 main 函数:
def main():
z = zipfile.ZipFile(r'./file.zip')
meta_str_len = len(meta_str)
meta_str_list = list(meta_str)
while True:
for n in range(1, 5):
while len(choiced_set) != meta_str_len ** n:
rand_str = ''.join(np.random.choice(meta_str_list, n, replace=True))
if rand_str not in choiced_set:
choiced_set.add(rand_str)
if guess(z, rand_str):
raise Exception('found')
choiced_set.clear()
耗时
以上代码虽然可以正常运行,但是解一个4位长度的密码需要计算 62 * 62 * 62 * 62 = 14776336 次,而且随着 choiced_set 的增长,生成非重复密码的概率越来越低,几乎是一个不可能完成的任务。
字母顺序密码
如果按顺序生成密码,总有一个密码能满足条件,比如: 元字符'abcd'生成2位密码,是一个笛卡尔积,其实就是一个字符全排列的过程,所以这里可以使用深度优先算法生成字符
调用 dfs_str(0) 即可不断生成 4 位长度的密码
一个简单的栗子:
def guess(v):
if v == 'abcd':
print('guessed pwd: {}'.format(v))
return True
else:
print('invalid pwd: {}'.format(v))
return False
meta_str = 'abcd1234'
chars = []
def dfs_str(step):
if step >= 4:
if guess(''.join(chars)):
raise Exception('found')
return
for ch in meta_str:
chars.append(ch)
dfs_str(step + 1)
chars.pop()
密码生成器
使用这种方式 guess 函数处于深度优先搜索算法中,耦合紧密,那么有没有办法一次生成一个密码,然后传给 guess 呢?当然是有的,这时候轮到生成器出场了
实现一个密码生成器,只需要一些小的改动,在函数里增加 yield 关键字
def dfs_str_gen(step):
if step >= 4:
yield ''.join(chars)
return
for ch in meta_str:
chars.append(ch)
yield from dfs_str_gen(step + 1)
chars.pop()
密码生成器类
上面的代码已经限定了只能生成 4 位长度的密码,然而我们的密码可能是 1 2 3 4 5 甚至8位以上,难道每次都要手动修改吗?或者是在 dfs_str_gen 里传入参数?
当然传参可以,离我的目标很近了,然而更好的办法是包装成一个 class, 初始化时传入想要生成密码的长度:
class PasswordGenerator:
meta_str = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
def __init__(self, n=4):
self.maxlen = n
self.endstr = self.meta_str[-1] * self.maxlen # 标记循环结束字符串
self.chars = []
self.g = self._proxy_gen()
def _dfs_str(self, step):
if step >= self.maxlen:
yield ''.join(self.chars)
return
for ch in self.meta_str:
self.chars.append(ch)
yield from self._dfs_str(step + 1)
self.chars.pop()
def _proxy_gen(self):
while True:
yield from self._dfs_str(0)
def __iter__(self):
return self
def __next__(self):
s = self.g.send(None)
if s == self.endstr:
self.g.close()
return s
调用 PasswordGenerator(n) 即可生成 n 位长度的密码
itertools 生成器
写了这么多,其实标准库 itertools 已经有了解决方案
import itertools
meta_str = 'abcdefg'
itertools.product(meta_str, repeat=4)