<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          溫故知新 | VAE 模型推導(dǎo)與總結(jié)

          共 1519字,需瀏覽 4分鐘

           ·

          2022-03-01 21:49

          點擊上方“程序員大白”,選擇“星標(biāo)”公眾號

          重磅干貨,第一時間送達

          來源:知乎—胖西西? 文僅分享,侵刪

          https://zhuanlan.zhihu.com/p/434394556

          此總結(jié)首次完成于2021年4月25日,今日再次遇到vae模型推導(dǎo)問題,翻出一看,豁然開朗,故想分享于知乎社區(qū),與大家共同分享,如有錯誤或不同見解請多多批評指正與交流。

          摘要

          VAE 模型 loss 的詳細推導(dǎo)過程,變分自編碼器的理解。


          01

          模型與說明

          1.1 VAE模型基本網(wǎng)絡(luò)結(jié)構(gòu)

          變分自編碼器 (VAE) 由編碼器和解碼器兩個部分組成。特征 x 輸入編碼器????生成編碼特征 z,z 輸入解碼器????生成重構(gòu)的 ; 通過生成角度來理解,該網(wǎng)絡(luò)又可以分成推理網(wǎng)絡(luò)和生成網(wǎng)絡(luò)兩部分。

          圖1:VAE模型, ( | )表示推斷網(wǎng)絡(luò), ( | )表示的生成網(wǎng)絡(luò)(公式格式存在問題)

          1.2????與????的理解

          ???是編碼器/推理網(wǎng)絡(luò),????該分布是真實的、復(fù)雜的,也是我們想去逼近的;而????是我們自己定的,用來逼近或者約束????的一個分布,????是簡單的,可主觀決定的。

          1.3 說明

          變分自編碼器所謂變分,指的是該模型存在泛函????,解決該泛函問題需要采用變分法,也就是尋找一個函數(shù)/參數(shù)????。


          02

          公式推導(dǎo)

          首先需要明確VAE模型的目的就是為了使得似然函數(shù)????最大。

          2.1 使得似然函數(shù)????最大,為什么轉(zhuǎn)化成使得???(變分下界)最大?

          由貝葉斯定理:

          公式1變形有:

          公式2左右對????取????有:

          變形有,其中????為任一分布

          公式3兩端對????求期望:

          將公式4期望展開有:

          由kl散度定義,????有:

          令????,并且由定義知道????有:

          當(dāng)且僅當(dāng)????時,????,否則,????,將????視為一個以????為參數(shù)的泛函有:

          改變????并不能影響????的大小,而且????大于????,那么欲似然????更大,可從????下手,當(dāng)????越大的情況下,似然????就會更大

          所以可以來最大化????使得似然最大,使用神經(jīng)網(wǎng)絡(luò)的時候要注意,對????進行優(yōu)化,優(yōu)化目標(biāo)使得????最小即可

          2.2 對????再推導(dǎo)

          因為對于????,????與????獨立,所以為了與encoder????接近,故將????,修改為????,有:

          設(shè)重構(gòu)的x服從于高斯分布(????),則有

          設(shè)????服從于多元高斯分布????,另????(認為設(shè)定的)服從于????的分布,有(15)式:

          ???二階矩為???,所以有:

          根據(jù)重構(gòu)項和KL散度項的約束,我們可以得出(19)式

          !!!!注意,????我們想讓他越大越好,但在神經(jīng)網(wǎng)絡(luò)優(yōu)化中,我們對????先取負,轉(zhuǎn)化成-????再優(yōu)化,此時,-????越小越



          03

          總結(jié)

          根據(jù)以往經(jīng)驗,容易犯錯誤的地方有,使用神經(jīng)網(wǎng)絡(luò)時候,一定要對ELBO先取負再優(yōu)化!

          很久之前發(fā)布的文件與代碼

          https://gitee.com/sulei_ustb/vae-model

          13個你一定要知道的PyTorch特性

          解讀:為什么要做特征歸一化/標(biāo)準化?

          一文搞懂 PyTorch 內(nèi)部機制

          張一鳴:每個逆襲的年輕人,都具備的底層能力


          關(guān)


          學(xué),西學(xué)學(xué),質(zhì)結(jié)關(guān)[],學(xué)習(xí)


          瀏覽 122
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  伊人成人网络 | 伊人大香蕉电影院 | 国语对白久久 | 囯产一级持黄视频 | 蜜臀av在线观看 午夜高清无码视频 |