一小段Python代碼,破解加密zip文件的密碼
今天的文章來(lái)自 盞茶作酒 同學(xué)。他在老電腦中發(fā)現(xiàn)了一個(gè)加密的 zip 文件,于是用 Python 破解了文件密碼。在破解的過(guò)程中出現(xiàn)了內(nèi)存爆炸的問(wèn)題,通過(guò)閱讀 Python 源代碼找到了解決方案。
下面就來(lái)給大家分享一下他的操作。
Python 有一個(gè)內(nèi)置模塊 zipfile 可以解壓 zip 壓縮包。先來(lái)測(cè)試一波:創(chuàng)建一個(gè)測(cè)試文件,壓縮,設(shè)置解壓密碼為123。

import zipfile
# 創(chuàng)建文件句柄
file = zipfile.ZipFile("測(cè)試.zip", 'r')
# 提取壓縮文件中的內(nèi)容,注意密碼必須是bytes格式,path表示提取到哪
file.extractall(path='.', pwd='123'.encode('utf-8'))
運(yùn)行效果如下圖所示,提取成功。

既然如此,那我不停嘗試所有可能的密碼組合去解壓縮不就行了嘛~

好了,開(kāi)始破解老文件的密碼。
為了提高速度,我還加了多線(xiàn)程的代碼:
import zipfile
import itertools
from concurrent.futures import ThreadPoolExecutor
def extract(file, password):
if not flag: return
file.extractall(path='.', pwd=''.join(password).encode('utf-8'))
def result(f):
exception = f.exception()
if not exception:
# 如果獲取不到異常說(shuō)明破解成功
print('密碼為:', f.pwd)
global flag
flag = False
if __name__ == '__main__':
# 創(chuàng)建一個(gè)標(biāo)志用于判斷密碼是否破解成功
flag = True
# 創(chuàng)建一個(gè)線(xiàn)程池
pool = ThreadPoolExecutor(100)
nums = [str(i) for i in range(10)]
chrs = [chr(i) for i in range(65, 91)]
# 生成數(shù)字+字母的6位數(shù)密碼
password_lst = itertools.permutations(nums + chrs, 6)
# 創(chuàng)建文件句柄
zfile = zipfile.ZipFile("加密文件.zip", 'r')
for pwd in password_lst:
if not flag: break
f = pool.submit(extract, zfile, pwd)
f.pwd = pwd
f.pool = pool
f.add_done_callback(result)
然而,事情并沒(méi)有那簡(jiǎn)單……
代碼跑一會(huì)兒,內(nèi)存爆了!


于是,為了找尋問(wèn)題所在,我就去查看了一下源碼,發(fā)現(xiàn)ThreadPoolExecutor默認(rèn)使用的是無(wú)界隊(duì)列。而程序中嘗試密碼的速度跟不上生產(chǎn)密碼的速度,就會(huì)把生產(chǎn)任務(wù)無(wú)限添加到隊(duì)列中。導(dǎo)致內(nèi)存被占滿(mǎn)。內(nèi)存直接飆到95:

找到病根兒,剩下的就是對(duì)癥下藥了。
繼承并重寫(xiě)了ThreadPoolExecutor類(lèi)中的_work_queue屬性,將無(wú)界隊(duì)列改成有界隊(duì)列,這樣就不會(huì)出現(xiàn)內(nèi)存爆滿(mǎn)的問(wèn)題,看代碼:
import queue
from concurrent.futures import ThreadPoolExecutor
class BoundedThreadPoolExecutor(ThreadPoolExecutor):
def __init__(self, max_workers=None, thread_name_prefix=''):
super().__init__(max_workers, thread_name_prefix)
self._work_queue = queue.Queue(self._max_workers * 2) # 設(shè)置隊(duì)列大小
用自定義的BoundedThreadPoolExecutor類(lèi)替代前面代碼中的ThreadPoolExecutor。
再次執(zhí)行……

程序輸入如下圖內(nèi)容:

)
推薦閱讀:
入門(mén): 最全的零基礎(chǔ)學(xué)Python的問(wèn)題 | 零基礎(chǔ)學(xué)了8個(gè)月的Python | 實(shí)戰(zhàn)項(xiàng)目 |學(xué)Python就是這條捷徑
干貨:爬取豆瓣短評(píng),電影《后來(lái)的我們》 | 38年NBA最佳球員分析 | 從萬(wàn)眾期待到口碑撲街!唐探3令人失望 | 笑看新倚天屠龍記 | 燈謎答題王 |用Python做個(gè)海量小姐姐素描圖 |
趣味:彈球游戲 | 九宮格 | 漂亮的花 | 兩百行Python《天天酷跑》游戲!
AI: 會(huì)做詩(shī)的機(jī)器人 | 給圖片上色 | 預(yù)測(cè)收入 | 碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影
年度爆款文案

