一個(gè)神奇的開源項(xiàng)目:讓照片快速 3D 化!
點(diǎn)擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)

拿起以往的老照片,無一不是灰蒙蒙的。那么有沒有一種方法將這些老照片重?zé)ㄉ鷻C(jī)呢? 近日,弗吉尼亞理工等機(jī)構(gòu)開發(fā)出了一種語境感知分層深度修復(fù)技術(shù),它利用基于學(xué)習(xí)的修復(fù)模型來迭代地合成新的顏色和深度信息,并借助標(biāo)準(zhǔn)圖形引擎將這些老照片渲染成 3D 照片。
論文地址:https://arxiv.org/pdf/2004.04727.pdf?
項(xiàng)目地址:?https://github.com/vt-vl-lab/3d-photo-inpainting?
網(wǎng)站地址:?https://shihmengli.github.io/3D-Photo-Inpainting/?
Colab 地址:https://colab.research.google.com/drive/1706ToQrkIZshRSJSHvZ1RuCiM__YX3Bz?
圖像預(yù)處理:首先初始化 LDI,LDI 使用單個(gè)層,且完全 4-connected。在預(yù)處理過程中,檢測(cè)主要的深度不連續(xù)區(qū)域,并將它們分為簡(jiǎn)單的連接深度邊緣(connected depth edge)。這構(gòu)成了主算法的基礎(chǔ),該算法的核心部分式迭代地選擇深度邊緣進(jìn)行修復(fù);
語境和合成區(qū)域:斷開邊緣上的 LDI 像素,只修復(fù)邊緣的背景像素。具體做法是從邊緣的「已知」側(cè)提取局部語境區(qū)域,在「未知」側(cè)生成合成區(qū)域;
語境感知的顏色和深度修復(fù):合成區(qū)域是新像素的連續(xù) 2D 區(qū)域,研究者使用基于學(xué)習(xí)的方法從給定語境中為其生成顏色和深度值;
形成 3D 紋理網(wǎng)格:修復(fù)完成后,將合成像素合并到 LDI 像素。
該方法按照以上流程迭代進(jìn)行,直到所有深度邊緣都得到處理。












Linux (已在 Ubuntu 18.04.4 LTS 上測(cè)試)
Anaconda
Python 3.7 (已在 3.7.4 上測(cè)試)
PyTorch 1.4.0 (已在 1.4.0 測(cè)試執(zhí)行)
運(yùn)行以下命令
conda create -n 3DP python=3.7 anacondaconda activate 3DPpip install -r requirements.txtconda install pytorch==1.4.0 torchvision==0.5.0 cudatoolkit==10.1.243 -c pytorch
下載模型權(quán)重
chmod +x download.sh./download.sh
將 .jpg 文件 (e.g., test.jpg) 放入 image 文件夾中.
如?image/moon.jpg
運(yùn)行:
python main.py --config argument.yml
通常情況下處理時(shí)間為 2-3 分鐘,具體取決于可用的計(jì)算資源。
將結(jié)果存儲(chǔ)再以下目錄中:
MiDas 估算的對(duì)應(yīng)深度 tu
如?depth/moon.npy
3D 網(wǎng)格
如?mesh/moon.ply
具有放大效果的渲染視頻
如?video/moon_zoom-in.mp4
具有擺動(dòng)效果的渲染 shi'p
如?video/moon_swing.mp4
渲染視頻并進(jìn)行 circle motion
如?video/moon_circle.mp4
交流群
歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺SLAM“。請(qǐng)按照格式備注,否則不予通過。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~

