有人說(shuō),馬賽克的發(fā)明,就是人類文明史上一次重大的“開倒車”。
也有人說(shuō),馬賽克就是阻礙人類進(jìn)步的絆腳石。
從功能上講,馬賽克是一種用來(lái)遮蓋原畫面的手段,有利也有弊。
從技術(shù)上講,馬賽克的原理是將某一個(gè)像素的顏色涂抹到整個(gè)范圍而造成原畫信息丟失。
所以,這個(gè)過(guò)程是不可逆的。
在個(gè)人隱私極其容易泄露的網(wǎng)絡(luò)時(shí)代,大家可能都會(huì)使用馬賽克來(lái)遮蓋圖片上的敏感信息。
比如身份證號(hào)、姓名、地址,用馬賽克掩蓋后,就能有效達(dá)到保護(hù)信息安全的目的。
但同樣的,在影視漫畫作品中,每當(dāng)出現(xiàn)兒童不宜或者血腥暴力的場(chǎng)景,都極有可能伴隨著厚重的馬賽克。就算是正兒八經(jīng)的畫面,只要帶上馬賽克,畫風(fēng)就會(huì)變得奇奇怪怪起來(lái)。雖然老司機(jī)門早就練成“心中無(wú)碼自然高清”的最高境界。但有碼觀影,始終如同隔靴搔癢,如鯁在喉。俗話說(shuō)的好,XX是第一科技生產(chǎn)力。自從人類世界出現(xiàn)了馬賽克后,自然也有人專注于如何去碼。一直以來(lái),號(hào)稱能去除馬賽克的軟件層出不窮,但大多都是掛著羊頭賣狗肉的惡意病毒軟件。然而近期在Github上,又出現(xiàn)了一款號(hào)稱能抹去馬賽克讓原圖重現(xiàn)的神器,引發(fā)海內(nèi)外熱議。這款工具名為Depix,上線沒幾天就在GitHub上標(biāo)星已超過(guò)一萬(wàn)多,截止目前累計(jì)分支也超過(guò)了1.3k個(gè)。如圖所示,第一行是打了一層巨厚馬賽克完全像素化后的文本內(nèi)容,看不出一點(diǎn)原始痕跡。第二行則是經(jīng)過(guò)AI還原后的內(nèi)容,可以看到內(nèi)容其實(shí)基本上已經(jīng)被還原了,而且準(zhǔn)確度很高。第三行就是根據(jù)第二行稍加推理得到的原始密碼了。是的,最難被還原、甚至理論上說(shuō)根本無(wú)法還原的文字,也在重重厚碼之后被Depix還原了!這意味著,就算大家以后把姓名/身份證號(hào)/電話等個(gè)人敏感信息都打上了馬賽克發(fā)布到網(wǎng)上,也有可能被別人扒得一干二凈。那么,這個(gè)不可思議的AI還原技術(shù)是如何實(shí)現(xiàn)的?據(jù)項(xiàng)目作者介紹,使用 Depix 將打上馬賽克的文字恢復(fù)成原圖,只需要簡(jiǎn)單的四步:
- 從屏幕截圖中截取像素塊作為一個(gè)選區(qū)。
- 在具有相同字體設(shè)置(包括文本大小、字體、顏色、hsl)的編輯器中,粘貼具有預(yù)期字符的De Bruijn序列。
- 制作一個(gè)序列的屏幕截圖,盡可能使用與創(chuàng)建像素化圖像相同的屏幕截圖工具。
python depix.py -p[pixelated rectangle image] -s [search sequence image] -o output.png
我們知道,打碼是圖像像素化處理的一種手段,它是通過(guò)將影像特定區(qū)域的色階細(xì)節(jié)劣化并打亂色塊,達(dá)到一種模糊圖像的效果。
線性盒濾波器則是其中一種較為普遍的處理算法。
如下圖所示,一個(gè)表情圖像打碼后,實(shí)際上被分為四個(gè)色塊,每個(gè)色塊被色塊平均值所覆蓋,最終形成了像素化表情。
由于原始信息丟失,因此不能直接反轉(zhuǎn)濾波器。

Depix的算法,就是利用了線性盒濾波器分別處理每個(gè)色塊的特點(diǎn),對(duì)搜索圖像中的每一個(gè)塊進(jìn)行像素化來(lái)尋找直接匹配。
簡(jiǎn)單來(lái)說(shuō),Depix的技術(shù)原理就是,將馬賽克區(qū)域的內(nèi)容分割成許多個(gè)小塊,然后再利用算法對(duì)每個(gè)小塊的內(nèi)容進(jìn)行平均值計(jì)算并覆蓋等。
目前,Depix這款工具還屬于特定領(lǐng)域的工具,只適用于使用線性方框?yàn)V波器創(chuàng)建的像素化圖像,且支持的主要是英文字母、數(shù)字以及英文半角下的符號(hào)等。經(jīng)過(guò)測(cè)試,絕大多數(shù)英文字母、數(shù)字和符號(hào)可以通過(guò)Depix正確識(shí)別出來(lái)。不過(guò),開發(fā)者在研究過(guò)程中發(fā)現(xiàn)某些連寫的字符無(wú)法正確識(shí)別,因此也要進(jìn)行改進(jìn)。雖然Depix算法輸出的結(jié)果并不太完美,但相比之前的其它技術(shù)而言,已經(jīng)算不錯(cuò)的了。Depix的相關(guān)消息在網(wǎng)上傳開后立刻引發(fā)熱議,許多網(wǎng)友對(duì)這項(xiàng)技術(shù)表示了深切擔(dān)憂。開發(fā)者強(qiáng)調(diào)稱,開發(fā)這個(gè)AI項(xiàng)目并不是為了竊取信息,而是利用ECB和明文攻擊的模式,提高信息保護(hù)技術(shù)。他還在博客中建議大家,基于安全考慮,請(qǐng)不要使用馬賽克,最佳做法是直接將需要遮擋的區(qū)域使用黑條或者白條覆蓋,這樣是無(wú)法通過(guò)算法還原的。當(dāng)然,除了Depix以外,試圖對(duì)馬賽克內(nèi)容進(jìn)行還原的開源項(xiàng)目還有很多。此前,擴(kuò)展迷也跟大家介紹過(guò)一款名為PULSE的算法——它能根據(jù)模糊的馬賽克像素“畫”出一張新的人臉,在幾秒內(nèi)就能將圖像原始分辨率放大64倍,任何渣畫質(zhì)都可以秒變高清、逼真圖像。細(xì)致到眉毛、睫毛、毛孔、皺紋、頭發(fā),都能神還原。對(duì)于這類項(xiàng)目的火爆,網(wǎng)上的質(zhì)疑聲一片,這些AI技術(shù)不可避免地被有些人用于不良或非法用途。可以預(yù)見的是,AI還原馬賽克技術(shù)將會(huì)越來(lái)越成熟,未來(lái)關(guān)于去馬賽克的倫理道德、法律層面的問(wèn)題也會(huì)越來(lái)越復(fù)雜。為了方便讀者,我已經(jīng)將代碼下載后上傳到百度云盤獲取方式
第 1 步:掃碼關(guān)注「啟艦雜談」公眾號(hào)
第 2 步:回復(fù)數(shù)字 121 即可獲取資料