手把手教你用Python破解加密 zip 文件的密码

àì夳堔傛蜴生んèń 2022-10-15 15:51 461阅读 0赞

今天的文章来自【盏茶作酒】同学。这位同学在老电脑中发现了一个加密的 zip 文件,于是用 Python 破解了文件密码。在破解的过程中出现了内存爆炸的问题,通过阅读 Python 源代码找到了解决方案。

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

置酒长安道,同心与我违。

3343c250b43fa5a72a2ac074bd287d6b.png

摄影:产品经理

海鲜咖喱泡饭

之前在家里的老电脑中,发现一个加密zip压缩包,由于时隔太久忘记密码了,依稀记得密码是6位字母加数字,网上下载了很多破解密码的软件都没有效果,于是想到自己用Python写一个暴力破解密码的脚本。

Python有一个内置模块zipfile可以干这个事情,测试一波,一个测试文件,设置解压密码为123。

5d3aaff32bb42ddadd697a4ffb2488dd.png

  1. import zipfile
  2. # 创建文件句柄
  3. file = zipfile.ZipFile("测试.zip", 'r')
  4. # 提取压缩文件中的内容,注意密码必须是bytes格式,path表示提取到哪
  5. file.extractall(path='.', pwd='123'.encode('utf-8'))

运行效果如下图所示,提取成功。

02ccf056a7718993808a15eb1f98dc47.png

好了开始破解老文件的密码,为了提高速度我加了多线程最初的代码:

  1. import zipfile
  2. import itertools
  3. from concurrent.futures import ThreadPoolExecutor
  4. def extract(file, password):
  5. if not flag: return
  6. file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
  7. def result(f):
  8. exception = f.exception()
  9. if not exception:
  10. # 如果获取不到异常说明破解成功
  11. print('密码为:', f.pwd)
  12. global flag
  13. flag = False
  14. if __name__ == '__main__':
  15. # 创建一个标志用于判断密码是否破解成功
  16. flag = True
  17. # 创建一个线程池
  18. pool = ThreadPoolExecutor(100)
  19. nums = [str(i) for i in range(10)]
  20. chrs = [chr(i) for i in range(65, 91)]
  21. # 生成数字+字母的6位数密码
  22. password_lst = itertools.permutations(nums + chrs, 6)
  23. # 创建文件句柄
  24. zfile = zipfile.ZipFile("加密文件.zip", 'r')
  25. for pwd in password_lst:
  26. if not flag: break
  27. f = pool.submit(extract, zfile, pwd)
  28. f.pwd = pwd
  29. f.pool = pool
  30. f.add_done_callback(result)

这个代码有个问题,跑一会儿内存就爆了!原因:ThreadPoolExecutor默认使用的是无界队列,尝试密码的速度跟不上生产密码的速度,会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95:

4d7a96382488f9333042b9f7f7d69221.png

然后程序奔溃:

57112e2cdbd5910d4be31733f15ed61b.png

看了一下源码发现ThreadPoolExecutor内部使用的是无界队列,所以导致内存直接飙满,重写ThreadPoolExecutor类中的_work_queue属性,将无界队列改成有界队列,这样就不会出现内存爆满的问题,看代码:

  1. import queue
  2. from concurrent.futures import ThreadPoolExecutor
  3. class BoundedThreadPoolExecutor(ThreadPoolExecutor):
  4. def __init__(self, max_workers=None, thread_name_prefix=''):
  5. super().__init__(max_workers, thread_name_prefix)
  6. self._work_queue = queue.Queue(self._max_workers * 2) # 设置队列大小

最后破解成功,如下图所示。

d8b900b348a4ac0de40943dca6495f3f.png

—----—-—-—---— End —----—---—-—---

往期精彩文章推荐:

  • 一篇文章带你解锁Python库中操作系统级别模块psutil

  • (Python实战文)一篇文章教会你Arrow 时间库在项目中的实际应用

  • 一篇文章带你了解Django ORM操作(高端篇)

86ec936a0b0324d41d7c9fc7660425a8.png

欢迎大家点赞,**留言,**转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

发表评论

表情:
评论列表 (有 0 条评论,461人围观)

还没有评论,来说两句吧...

相关阅读