<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          多模態(tài)生成GAN:hold住文字草圖語義圖!

          共 1630字,需瀏覽 4分鐘

           ·

          2021-12-18 05:07


          超110篇!CVPR 2021最全GAN論文匯總梳理!

          超100篇!CVPR 2020最全GAN論文梳理匯總!

          曉查 發(fā)自 凹非寺 量子位 報道 | 公眾號 QbitAI

          繼GauGAN2之后,英偉達(dá)推出了一個GAN的“超級縫合體”——PoE GAN

          PoE GAN可以接受多種模態(tài)的輸入,文字描述圖像分割、草圖風(fēng)格都可以轉(zhuǎn)化為圖片。

          而且它可以同時接受以上幾種輸入模態(tài)的任意兩種組合,這便是PoE的含義。

          所謂PoE是Hinton在2002年提出的“專家乘積”(product of experts)概念,每個專家(單獨模型)被定義為輸入空間上的一個概率模型。

          而每種單獨的輸入模態(tài)都是合成圖像必須滿足的約束條件,因此滿足所有約束的一組圖像是滿足每個約束集合的交集。

          假設(shè)每種約束的聯(lián)合條件概率分布都服從高斯分布,就用單條件概率分布的乘積來表述交集的分布。

          在此條件下,為了使乘積分布在一個區(qū)域具有高密度,每個單獨的分布需要在該區(qū)域具有高密度,從而滿足每個約束。

          而PoE GAN的重點是如何將每種輸入混合在一起。

          PoE GAN的設(shè)計

          PoE GAN的生成器使用全局PoE-Net將不同類型輸入的變化混合起來。

          我們將每個模態(tài)輸入編碼為特征向量,然后使用PoE匯總到全局PoE-Net中。解碼器不僅使用全局PoE-Net的輸出,還直接連接分割和草圖編碼器,以此來輸出圖像。

          全局PoE-Net的結(jié)構(gòu)如下,這里使用一個潛在的特征矢量z0作為樣本使用PoE,然后由MLP處理以輸出特征向量w。

          在鑒別器部分,作者提出了一種多模態(tài)投影鑒別器,將投影鑒別器推廣到處理多個條件輸入。

          與計算圖像嵌入和條件嵌入之間單個內(nèi)積的標(biāo)準(zhǔn)投影鑒別器不同,這里要計算每個輸入模態(tài)的內(nèi)積,并將其相加以獲得最終損失。

          隨意變換輸入的GAN

          PoE可以在單模態(tài)輸入、多模態(tài)輸入甚至無輸入時生成圖片。

          當(dāng)使用單個輸入模態(tài)進(jìn)行測試時,PoE-GAN的表現(xiàn)優(yōu)于之前專門為該模態(tài)設(shè)計的SOTA方法。

          例如在分割輸入模態(tài)中,PoE-GAN優(yōu)于此前的SPADE和OASIS。

          在文本輸入模態(tài),PoE-GAN優(yōu)于文本到圖像模型DF-GAN、DM-GAN+CL。

          當(dāng)以模式的任意子集為條件時,PoE-GAN可以生成不同的輸出圖像。下面展示了PoE-GAN的隨機樣本,條件是兩種模式(文本+分割、文本+草圖、分割+草圖)在景觀圖像數(shù)據(jù)集上。

          PoE-GAN甚至還能沒有輸入,此時PoE-GAN就會成為一個無條件的生成模型。以下是PoE-GAN無條件生成的樣本。

          團(tuán)隊介紹

          論文通訊作者是英偉達(dá)著名工程師劉洺堉,他的研究重點是深度生成模型及其應(yīng)用。英偉達(dá)Canvas和GauGAN等有趣的產(chǎn)品均出自他手。

          論文一作是黃勛,北京航空航天大學(xué)本科畢業(yè),康奈爾大學(xué)博士,現(xiàn)在在英偉達(dá)工作。

          論文地址:
          https://arxiv.org/abs/2112.05130

          PoE:
          https://www.cs.toronto.edu/~hinton/absps/icann-99.pdf

          投影鑒別器:
          https://arxiv.org/abs/1802.05637



          猜您喜歡:

          超110篇!CVPR 2021最全GAN論文匯總梳理!

          超100篇!CVPR 2020最全GAN論文梳理匯總!

          拆解組新的GAN:解耦表征MixNMatch

          StarGAN第2版:多域多樣性圖像生成


          附下載 |?《可解釋的機器學(xué)習(xí)》中文版

          附下載 |《TensorFlow 2.0 深度學(xué)習(xí)算法實戰(zhàn)》

          附下載 |《計算機視覺中的數(shù)學(xué)方法》分享


          《基于深度學(xué)習(xí)的表面缺陷檢測方法綜述》

          《零樣本圖像分類綜述: 十年進(jìn)展》

          《基于深度神經(jīng)網(wǎng)絡(luò)的少樣本學(xué)習(xí)綜述》


          瀏覽 43
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美成人性爱视频在线 | 影音先锋在线播放99av | 欧美及黄视频在线观看 | 青青操逼| 精品黄片免费看 |