溫故知新 | VAE 模型推導(dǎo)與總結(jié)
點擊上方“程序員大白”,選擇“星標(biāo)”公眾號
重磅干貨,第一時間送達

https://zhuanlan.zhihu.com/p/434394556
此總結(jié)首次完成于2021年4月25日,今日再次遇到vae模型推導(dǎo)問題,翻出一看,豁然開朗,故想分享于知乎社區(qū),與大家共同分享,如有錯誤或不同見解請多多批評指正與交流。
摘要
VAE 模型 loss 的詳細推導(dǎo)過程,變分自編碼器的理解。
01
1.1 VAE模型基本網(wǎng)絡(luò)結(jié)構(gòu)
變分自編碼器 (VAE) 由編碼器和解碼器兩個部分組成。特征 x 輸入編碼器??

1.2??
?
1.3 說明
變分自編碼器所謂變分,指的是該模型存在泛函??
02
首先需要明確VAE模型的目的就是為了使得似然函數(shù)??
2.1 使得似然函數(shù)??
由貝葉斯定理:

公式1變形有:

公式2左右對??

變形有,其中??

公式3兩端對??

將公式4期望展開有:

由kl散度定義,??

令??

當(dāng)且僅當(dāng)??

改變??
所以可以來最大化??
2.2 對??

因為對于??

設(shè)重構(gòu)的x服從于高斯分布(??

設(shè)??

?

根據(jù)重構(gòu)項和KL散度項的約束,我們可以得出(19)式

!!!!注意,??

03
根據(jù)以往經(jīng)驗,容易犯錯誤的地方有,使用神經(jīng)網(wǎng)絡(luò)時候,一定要對ELBO先取負再優(yōu)化!
很久之前發(fā)布的文件與代碼
https://gitee.com/sulei_ustb/vae-model
推薦閱讀
關(guān)于程序員大白
程序員大白是一群哈工大,東北大學(xué),西湖大學(xué)和上海交通大學(xué)的碩士博士運營維護的號,大家樂于分享高質(zhì)量文章,喜歡總結(jié)知識,歡迎關(guān)注[程序員大白],大家一起學(xué)習(xí)進步!

