深度學(xué)習(xí)必須掌握的 13 種概率分布


共軛意味著它有共軛分布的關(guān)系。
在貝葉斯概率論中,如果后驗(yàn)分布 p(θx)與先驗(yàn)概率分布 p(θ)在同一概率分布族中,則先驗(yàn)和后驗(yàn)稱為共軛分布,先驗(yàn)稱為似然函數(shù)的共軛先驗(yàn)。共軛先驗(yàn)維基百科在這里(https://en.wikipedia.org/wiki/Conjugate_prior)。
多分類表示隨機(jī)方差大于 2。
n 次意味著我們也考慮了先驗(yàn)概率 p(x)。
為了進(jìn)一步了解概率,我建議閱讀 [pattern recognition and machine learning,Bishop 2006]。

先驗(yàn)概率 p(x)不考慮伯努利分布。因此,如果我們對(duì)最大似然進(jìn)行優(yōu)化,那么我們很容易被過度擬合。
利用二元交叉熵對(duì)二項(xiàng)分類進(jìn)行分類。它的形式與伯努利分布的負(fù)對(duì)數(shù)相同。

參數(shù)為 n 和 p 的二項(xiàng)分布是一系列 n 個(gè)獨(dú)立實(shí)驗(yàn)中成功次數(shù)的離散概率分布。 二項(xiàng)式分布是指通過指定要提前挑選的數(shù)量而考慮先驗(yàn)概率的分布。

多伯努利稱為分類分布。 交叉熵和采取負(fù)對(duì)數(shù)的多伯努利分布具有相同的形式。


β分布與二項(xiàng)分布和伯努利分布共軛。 利用共軛,利用已知的先驗(yàn)分布可以更容易地得到后驗(yàn)分布。 當(dāng)β分布滿足特殊情況(α=1,β=1)時(shí),均勻分布是相同的。

dirichlet 分布與多項(xiàng)式分布是共軛的。 如果 k=2,則為β分布。

如果 gamma(a,1)/gamma(a,1)+gamma(b,1)與 beta(a,b)相同,則 gamma 分布為β分布。 指數(shù)分布和卡方分布是伽馬分布的特例。




k 自由度的卡方分布是 k 個(gè)獨(dú)立標(biāo)準(zhǔn)正態(tài)隨機(jī)變量的平方和的分布。
卡方分布是 β 分布的特例


評(píng)論
圖片
表情
