溫故知新 | VAE 模型推導(dǎo)與總結(jié)
https://zhuanlan.zhihu.com/p/434394556
此總結(jié)首次完成于2021年4月25日,今日再次遇到vae模型推導(dǎo)問題,翻出一看,豁然開朗,故想分享于知乎社區(qū),與大家共同分享,如有錯(cuò)誤或不同見解請(qǐng)多多批評(píng)指正與交流。
摘要
VAE 模型 loss 的詳細(xì)推導(dǎo)過程,變分自編碼器的理解。
01
1.1 VAE模型基本網(wǎng)絡(luò)結(jié)構(gòu)
變分自編碼器 (VAE) 由編碼器和解碼器兩個(gè)部分組成。特征 x 輸入編碼器??

1.2??
?
1.3 說明
變分自編碼器所謂變分,指的是該模型存在泛函??
02
首先需要明確VAE模型的目的就是為了使得似然函數(shù)??
2.1 使得似然函數(shù)??
由貝葉斯定理:

公式1變形有:

公式2左右對(duì)??

變形有,其中??

公式3兩端對(duì)??

將公式4期望展開有:

由kl散度定義,??

令??

當(dāng)且僅當(dāng)??

改變??
所以可以來最大化??
2.2 對(duì)??

因?yàn)閷?duì)于??

設(shè)重構(gòu)的x服從于高斯分布(??

設(shè)??

?

根據(jù)重構(gòu)項(xiàng)和KL散度項(xiàng)的約束,我們可以得出(19)式

!!!!注意,??

03
根據(jù)以往經(jīng)驗(yàn),容易犯錯(cuò)誤的地方有,使用神經(jīng)網(wǎng)絡(luò)時(shí)候,一定要對(duì)ELBO先取負(fù)再優(yōu)化!
很久之前發(fā)布的文件與代碼
https://gitee.com/sulei_ustb/vae-model
猜您喜歡:
?戳我,查看GAN的系列專輯~!附下載 |?《可解釋的機(jī)器學(xué)習(xí)》中文版
附下載 |《TensorFlow 2.0 深度學(xué)習(xí)算法實(shí)戰(zhàn)》
附下載 |《計(jì)算機(jī)視覺中的數(shù)學(xué)方法》分享
《基于深度學(xué)習(xí)的表面缺陷檢測(cè)方法綜述》
《基于深度神經(jīng)網(wǎng)絡(luò)的少樣本學(xué)習(xí)綜述》
