開源 | 用深度學(xué)習(xí)讓你的照片變得美麗
點(diǎn)擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達(dá)
在挑選手機(jī)時,手機(jī)攝像頭往往是我們考慮的重要因素之一,但目前很多手機(jī)拍出來的照片效果不盡如人意。如何用深度學(xué)習(xí)的方法美化照片?George Seif 發(fā)表了一篇文章,是關(guān)于如何自動增強(qiáng)低質(zhì)量相機(jī)拍攝的照片,大家快來實(shí)戰(zhàn)吧~

照相是一項很棒的技術(shù)。它讓我們能夠保存自己的記憶,當(dāng)看到照片中的景色時,我們可以重新體驗它們。
這項技術(shù)在過去的幾年里取得了長足的進(jìn)步。隨著 4K、HDR 和彩色增強(qiáng)等各種新功能的出現(xiàn),您可以拍攝出令人驚嘆的照片。
但它確實(shí)是有代價的。不是每個人都買得起最好的相機(jī)。DSLR 相機(jī)的價格從幾百美元到幾千美元不等。不僅如此,也不是每個人都能用這些相機(jī)拍出好的照片,畢竟我們并不都是專業(yè)攝影師!
我們大多數(shù)人拍照用的是智能手機(jī),但與高端 DSLR 相比,智能手機(jī)拍攝的照片通常非常平淡。
深度學(xué)習(xí)改變了這一切。
美化你的照片
來自蘇黎世 ETH 計算機(jī)視覺實(shí)驗室的研究展示了如何自動增強(qiáng)低質(zhì)量相機(jī)拍攝的照片,使它們看起來像是由專業(yè)攝影師用 DSLR 拍攝的。他們是這樣做的:
該團(tuán)隊首先收集了一組低質(zhì)量(來自手機(jī))和高質(zhì)量(來自 DSLR)照片作為數(shù)據(jù)集,您可以從項目頁面下載這些照片。這正是我們需要的用于這種增強(qiáng)任務(wù)的數(shù)據(jù):輸入低質(zhì)量的圖像(來自手機(jī))并讓深度網(wǎng)絡(luò)嘗試預(yù)測高質(zhì)量版本(來自 DSLR)的樣子。
一個圖像有幾個我們可能想要增強(qiáng)的屬性:燈光、顏色、紋理、對比度和清晰度。深度網(wǎng)絡(luò)經(jīng)過訓(xùn)練,可以利用四種不同的損失函數(shù)來描述所有這些屬性:
顏色損失:預(yù)測圖像和目標(biāo)圖像模糊版本之間的歐幾里得距離。
紋理損失:基于生成對抗網(wǎng)絡(luò)(GAN)的分類損失。GAN 被訓(xùn)練來預(yù)測灰度照片質(zhì)量的高低。由于使用了灰度圖,網(wǎng)絡(luò)將很好地聚焦于圖像的紋理,而不是顏色。
內(nèi)容損失:預(yù)測圖像的 VGG 特征與地面真像之間的差異。這一損失確保了圖像中的對象(即圖像語義)和整體結(jié)構(gòu)保持不變。
總變化損失:圖像中的垂直和水平總梯度。這將增強(qiáng)圖像的平滑度,這樣最終得到的圖像就不會太粗糙或有噪音。
最后將這些損失加起來,生成一個端到端的網(wǎng)絡(luò),通過訓(xùn)練網(wǎng)絡(luò)來做預(yù)測!

代碼
感謝 AI 社區(qū)中開放源碼,我們在這里找到了一個公開的照片增強(qiáng)器項目!以下是您使用它的方法。
Git 源碼地址:https://github.com/aiff22/DPED
安裝需要的庫文件:
pip install tensorflow-gpu
pip install numpy
pip install scipy
所有經(jīng)過預(yù)先訓(xùn)練的模型都已經(jīng)在 models_orig 文件夾中都有對應(yīng)的庫,因此無需下載它們!
將要增強(qiáng)的照片放在以下目錄中:
dped/iphone/test_data/full_size_test_images/
這是「iphone」的系統(tǒng)默認(rèn)目錄,但是如果您想更改代碼,可以更改 test_model.py 腳本中的代碼。之所以說「iphone」,是因為作者使用 3 款智能手機(jī)(iphone、sony 和 blackberry)拍攝的照片訓(xùn)練了 3 種不同的模型,因此你有三個選擇。但是這個模型在大多數(shù)這三種手機(jī)拍攝的照片上都能很好地工作,所以我們選擇其中一個就好。
最后,為了增強(qiáng)照片效果,我們運(yùn)行一個簡單的腳本:
python test_model.py model=iphone_orig \
test_subset=full \
哇!您的增強(qiáng)型和專業(yè)型照片將保存在「視覺效果」文件夾中!
你自己試試代碼,很有趣!看看你的照片如何處理增強(qiáng)。請在下面發(fā)布鏈接,與社區(qū)共享您的照片。同時,這里是我自己測試的一些結(jié)果。雷鋒網(wǎng)








來源:https://towardsdatascience.com/make-your-pictures-beautiful-with-a-touch-of-machine-learning-magic-31672daa3032
好消息!
小白學(xué)視覺知識星球
開始面向外開放啦??????
下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程 在「小白學(xué)視覺」公眾號后臺回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。 下載2:Python視覺實(shí)戰(zhàn)項目52講 在「小白學(xué)視覺」公眾號后臺回復(fù):Python視覺實(shí)戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實(shí)戰(zhàn)項目,助力快速學(xué)校計算機(jī)視覺。 下載3:OpenCV實(shí)戰(zhàn)項目20講 在「小白學(xué)視覺」公眾號后臺回復(fù):OpenCV實(shí)戰(zhàn)項目20講,即可下載含有20個基于OpenCV實(shí)現(xiàn)20個實(shí)戰(zhàn)項目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。 交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

