<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          真假難辨!AI人像生成再進(jìn)化!HyperHuman:基于隱式結(jié)構(gòu)擴(kuò)散的超逼真人像生成

          共 1302字,需瀏覽 3分鐘

           ·

          2023-10-24 03:28

          大家好,今天和大家分享最新的一篇 AI生成相關(guān)的工作,本文的重點(diǎn)在于對(duì)于人像生成的優(yōu)化,之前的工作,例如stable diffusion等,對(duì)于真人生成效果存在一定的缺陷,基于此為出發(fā)點(diǎn),本文貢獻(xiàn)了新的數(shù)據(jù)集,并提出一個(gè)新的隱式結(jié)構(gòu)擴(kuò)散模型結(jié)合姿態(tài)圖、深度圖等,生成更逼真的人像圖片。

          好久沒更新原創(chuàng)啦,兄弟們點(diǎn)點(diǎn)贊,以后多多更新,fighting!??!

          歡迎大家留言,你更想看到的內(nèi)容,實(shí)戰(zhàn)?論文?或經(jīng)驗(yàn)分享?

          https://snap-research.github.io/HyperHuman/

          https://github.com/snap-research/HyperHuman

          https://snap-research.github.io/HyperHuman/content/hyperhuman.pdf

          標(biāo)題:HyperHuman: Hyper-Realistic Human Generation with Latent Structural Diffusion

          背景:

          現(xiàn)在文本到圖像模型取得了重大進(jìn)展,但實(shí)現(xiàn)超逼真的人類圖像生成仍然是一項(xiàng)理想但尚未解決的任務(wù)。現(xiàn)有模型(例如stable diffusion和 DALL·E 2)往往會(huì)生成部分不連貫或姿勢(shì)不自然的人像圖片。為了應(yīng)對(duì)這些挑戰(zhàn),作者認(rèn)為,人類圖像本質(zhì)上是跨多個(gè)粒度的結(jié)構(gòu),從粗粒度的身體骨骼到細(xì)粒度的空間幾何。因此,在一個(gè)模型中捕獲顯式外觀和隱式結(jié)構(gòu)之間的這種相關(guān)性對(duì)于生成連貫且自然的人像圖片至關(guān)重

          主要貢獻(xiàn):

          提出了一個(gè)統(tǒng)一的框架 HyperHuman,它可以生成高度真實(shí)和多樣化布局的開放場(chǎng)景下的人像圖片。具體如下:

          1)首先構(gòu)建以人類為中心的大規(guī)模數(shù)據(jù)集,名為 HumanVerse,它由 3.4 億張圖像組成,具有人體姿勢(shì)、深度和表面法向量等詳細(xì)標(biāo)注。

          2)提出了一種隱式結(jié)構(gòu)擴(kuò)散模型(Latent Structural Diffusion Model),該模型可以同時(shí)對(duì)深度和表面法向量以及合成的 RGB 圖像進(jìn)行去噪。模型在統(tǒng)一網(wǎng)絡(luò)中強(qiáng)制執(zhí)行圖像外觀、空間關(guān)系和幾何形狀的聯(lián)合學(xué)習(xí),其中模型中的每個(gè)分支在結(jié)構(gòu)意識(shí)和紋理豐富性方面相互補(bǔ)充。

          3)最后,為了進(jìn)一步提高視覺質(zhì)量,提出了一種結(jié)構(gòu)引導(dǎo)細(xì)化器來組合預(yù)測(cè)條件,以更詳細(xì)地生成更高分辨率。大量的實(shí)驗(yàn)表明,我們的框架具有SOTA的性能,可以在不同的場(chǎng)景下生成超逼真的人類圖像。

          效果展示:

          和其他算法對(duì)比

          整體框架:

          HyperHuman 框架概述。在潛在結(jié)構(gòu)擴(kuò)散模型(紫色)中,圖像 x、深度 d 和表面法線 n 對(duì)圖片描述 c 和姿勢(shì)骨架 p 進(jìn)行聯(lián)合去噪調(diào)節(jié)。在結(jié)構(gòu)引導(dǎo)精煉器(藍(lán)色)中,我們構(gòu)建了更高分辨率生成的預(yù)測(cè)條件。請(qǐng)注意,灰色圖像是指隨機(jī)丟棄條件,以實(shí)現(xiàn)更穩(wěn)健的訓(xùn)練。

          定量分析結(jié)果:

          瀏覽 820
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲日韩电影在线 | 亚洲性爱网络 | 三级视频网 | 亚洲大鸡巴网 | 大香焦伊人国产 |