<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          一個(gè)用于styleGAN圖像處理的編碼器

          共 2958字,需瀏覽 6分鐘

           ·

          2021-02-12 14:28

          點(diǎn)擊上方小白學(xué)視覺(jué)”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時(shí)間送達(dá)


          小白導(dǎo)讀

          論文是學(xué)術(shù)研究的精華和未來(lái)發(fā)展的明燈。小白決心每天為大家?guī)?lái)經(jīng)典或者最新論文的解讀和分享,旨在幫助各位讀者快速了解論文內(nèi)容。個(gè)人能力有限,理解難免出現(xiàn)偏差,建議對(duì)文章內(nèi)容感興趣的讀者,一定要下載原文,了解具體內(nèi)容。


          源碼鏈接:https://github.com/omertov/encoder4editing


          摘要


          最近,通過(guò)使用預(yù)先訓(xùn)練過(guò)的無(wú)條件生成器來(lái)執(zhí)行圖像編輯的各種方法出現(xiàn)了激增。然而,在真實(shí)圖像上應(yīng)用這些方法仍然是一個(gè)挑戰(zhàn),因?yàn)樗厝恍枰獙D像反轉(zhuǎn)到它們的潛在空間。為了成功地反轉(zhuǎn)真實(shí)圖像,需要找到一種潛在的代碼來(lái)準(zhǔn)確地重建輸入圖像,更重要的是,允許對(duì)其進(jìn)行有意義的操作。本文詳細(xì)研究了最先進(jìn)的無(wú)條件生成器StyleGAN的潛在空間。作者識(shí)別并分析在樣式潛在空間中存在的扭曲-可編輯性權(quán)衡和扭曲-感知權(quán)衡。然后,作者提出了兩個(gè)設(shè)計(jì)編碼器的原則,使其能夠控制與StyleGAN最初訓(xùn)練的區(qū)域的倒置的接近性。作者提出了一個(gè)基于作者的兩個(gè)原則的編碼器,這是專為促進(jìn)編輯真實(shí)圖像,通過(guò)平衡這些權(quán)衡。通過(guò)對(duì)其在包括汽車和馬在內(nèi)的眾多具有挑戰(zhàn)性的領(lǐng)域的性能進(jìn)行定性和定量評(píng)價(jià),作者證明了作者的反演方法,以及常見(jiàn)的編輯技術(shù),在只有很小的重建精度下降的情況下,獲得了較高的真實(shí)圖像編輯質(zhì)量。


          本文創(chuàng)新點(diǎn)


          提出了定量和定性的結(jié)果證明distortion-editability distortion-perception權(quán)衡,和反相接近的好處w .作者評(píng)估作者的編碼器,顯示作者的方法及其適用性的泛化為各種具有挑戰(zhàn)性的領(lǐng)域,與面部域不同,沒(méi)有共同的結(jié)構(gòu)和可能包含大量的模式。在下圖中,作者展示了編碼器在多個(gè)領(lǐng)域中獲得的反轉(zhuǎn),以及使用各種編輯方法執(zhí)行的幾個(gè)操作??梢钥吹?,只有輕微的失真退化,作者能夠?qū)崿F(xiàn)合理的編輯圖像,同時(shí)保留原始圖像的內(nèi)容和質(zhì)量。

          總結(jié)一下,作者提出了四個(gè)主要貢獻(xiàn):

          • 作者分析了柱體的復(fù)雜潛伏空間,提出了柱體結(jié)構(gòu)的新觀點(diǎn)。

          • 作者展示了扭曲、感知和可編輯性之間固有的權(quán)衡。

          • 作者描述了這種權(quán)衡,并設(shè)計(jì)了兩種編碼器來(lái)控制它們。

          • 作者提出了e4e,一種新的編碼器,是專門設(shè)計(jì)的,允許隨后編輯倒轉(zhuǎn)的真實(shí)圖像。


          框架結(jié)構(gòu)


          作者的e4e網(wǎng)絡(luò)架構(gòu)。編碼器接收一個(gè)輸入圖像,并輸出一個(gè)樣式代碼w和一組偏移量1..N 1,其中N為StyleGAN s風(fēng)格調(diào)制層數(shù)。作者通過(guò)復(fù)制w向量N次并將每個(gè)i加到對(duì)應(yīng)的元素來(lái)獲得最終的潛在表示法。在訓(xùn)練期間,Ld-reg正則化鼓勵(lì)最終表示的不同條目之間存在較小的差異,從而保持接近W。Ladv將每個(gè)潛在代碼引導(dǎo)到StyleGAN映射網(wǎng)絡(luò)的范圍內(nèi),從而使最終的表示更接近于Wk。由于應(yīng)用了這兩個(gè)正則化項(xiàng),編碼器的最終學(xué)習(xí)表示接近于W。


          實(shí)驗(yàn)結(jié)果


          作者展示了源圖像的三聯(lián)體,它的反演,以及對(duì)多個(gè)域的反演圖像應(yīng)用的編輯。在奇數(shù)行,作者的基線編碼器(A)獲得反演。在偶數(shù)行,作者使用配置D,對(duì)接近w的圖像進(jìn)行編碼,觀察反演圖像的失真和感知質(zhì)量之間的權(quán)衡。例如,在白馬的圖像中,使用構(gòu)型A觀察倒像的低失真(例如馬鞍被保留)。但是,感知質(zhì)量比D得到的要低(如馬頭不真實(shí))。關(guān)于可編輯性,請(qǐng)注意,在女性的左上角圖像中,姿態(tài)編輯并沒(méi)有忠實(shí)地改變a中的頭發(fā)。相反,D以失真的細(xì)微退化為代價(jià),獲得了一個(gè)真實(shí)且視覺(jué)愉悅的編輯結(jié)果。從上到下,從左到右的編輯是:頭部姿勢(shì),性別,日光,觀點(diǎn)(x3),馬姿勢(shì),騎馬者,貓姿勢(shì)。

          扭曲感知和扭曲編輯的權(quán)衡。放大細(xì)節(jié)。左邊的圖像是源圖像。在頂部一行,作者展示了一系列圖像,其中最左邊的圖像是通過(guò)pSp得到的重建圖像,最右邊的圖像是通過(guò)e4e得到的重建圖像。當(dāng)作者向右移動(dòng)時(shí),反轉(zhuǎn)越接近W,失真越嚴(yán)重,感知質(zhì)量越好。然后,作者使用StyleFlow對(duì)每個(gè)倒置和插值圖像執(zhí)行性別編輯。注意,當(dāng)用于編輯的潛在代碼接近W時(shí),感知質(zhì)量變得明顯更好。例如,觀察最左邊編輯過(guò)的圖像中不真實(shí)的頭發(fā)。


          結(jié)論


          作者的主要貢獻(xiàn)有兩方面:

          • 作者提出了鼓勵(lì)將真實(shí)圖像的編碼映射到表現(xiàn)良好的Wk區(qū)域的方法;

          • 作者設(shè)計(jì)了一個(gè)編碼器,并根據(jù)失真和可編輯性之間的權(quán)衡,演示了其性能。


          作者也討論了評(píng)估重構(gòu)和可編輯性的困難,并提出了建立在常用措施上的評(píng)估協(xié)議。從某種意義上說(shuō),作者提出的方法是對(duì)圖像處理方法的一種補(bǔ)充,可以提高真實(shí)圖像的編輯質(zhì)量。


          一般來(lái)說(shuō),作者的編碼器鼓勵(lì)映射接近W,這工作得很好,因?yàn)閃周圍的空間仍然是令人驚訝的高度表達(dá)。此外,該原理還可用于圖像反演以外的問(wèn)題。例如,它可以應(yīng)用于地圖潛在的向量代表多個(gè)圖像,或者說(shuō)兩個(gè)的組合,如身份和姿態(tài)的解離表示,或混合的兩個(gè)圖片,一個(gè)合適的潛在目標(biāo)圖像的代碼可能存在于鄰近w。作者計(jì)劃去探索這個(gè)研究方向。


          作者的反演方案是通用的,作者已經(jīng)在五個(gè)具有挑戰(zhàn)性和多樣化的領(lǐng)域展示了它的性能。然而,請(qǐng)注意,有些領(lǐng)域比其他領(lǐng)域更難。人臉結(jié)構(gòu)良好,簡(jiǎn)化了編碼器的訓(xùn)練。例如,馬的領(lǐng)域就復(fù)雜得多,因?yàn)樗欠墙Y(jié)構(gòu)化的,并且有許多模式。因此,訓(xùn)練這樣一個(gè)領(lǐng)域的編碼器是非常具有挑戰(zhàn)性的。在未來(lái),作者將考慮像Sendik等人那樣的多模態(tài)生成器,并將編碼器開(kāi)發(fā)成多模態(tài)潛在空間。


          最后,在這里作者考慮到一個(gè)給定的潛在空間的反轉(zhuǎn)。在未來(lái),考慮對(duì)生成器進(jìn)行微調(diào),并訓(xùn)練編碼器和解碼器,使其針對(duì)特定的下游任務(wù)實(shí)現(xiàn)共同目標(biāo),將是一件有趣且具有挑戰(zhàn)性的事情。


          論文鏈接:https://arxiv.org/pdf/2102.02766.pdf


          每日?qǐng)?jiān)持論文分享不易,如果喜歡我們的內(nèi)容,希望可以推薦或者轉(zhuǎn)發(fā)給周圍的同學(xué)。


          - END -

          下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
          在「小白學(xué)視覺(jué)」公眾號(hào)后臺(tái)回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺(jué)、目標(biāo)跟蹤、生物視覺(jué)、超分辨率處理等二十多章內(nèi)容。

          下載2:Python視覺(jué)實(shí)戰(zhàn)項(xiàng)目52講
          小白學(xué)視覺(jué)公眾號(hào)后臺(tái)回復(fù):Python視覺(jué)實(shí)戰(zhàn)項(xiàng)目,即可下載包括圖像分割、口罩檢測(cè)、車道線檢測(cè)、車輛計(jì)數(shù)、添加眼線、車牌識(shí)別、字符識(shí)別、情緒檢測(cè)、文本內(nèi)容提取、面部識(shí)別等31個(gè)視覺(jué)實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺(jué)。

          下載3:OpenCV實(shí)戰(zhàn)項(xiàng)目20講
          小白學(xué)視覺(jué)公眾號(hào)后臺(tái)回復(fù):OpenCV實(shí)戰(zhàn)項(xiàng)目20講,即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。

          交流群


          歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺(jué)、傳感器自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺(jué)SLAM“。請(qǐng)按照格式備注,否則不予通過(guò)。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~


          瀏覽 70
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲青娱乐精品91 | 天天操天天天干 | 国产 无码 高潮 在线 | 哪里可以看日本黄色电影 | 国产强 暴 疼 哭 处 女 国产肉体ⅩXXX137大胆 |