<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          最大熵模型算法總結(jié)

          共 1991字,需瀏覽 4分鐘

           ·

          2021-09-16 08:11


          點(diǎn)擊左上方藍(lán)字關(guān)注我們



          一個(gè)專注于目標(biāo)檢測與深度學(xué)習(xí)知識(shí)分享的公眾號(hào)

          編者薦語
          熵的本質(zhì)是一個(gè)系統(tǒng)“內(nèi)在的混亂程度”。熵代表的是隨機(jī)變量或整個(gè)系統(tǒng)的不確定性,熵越大,隨機(jī)變量或系統(tǒng)的不確定性就越大。熵用來表示所有信息量的期望,即:當(dāng)越不可能的事件發(fā)生了,我們獲取到的信息量就越大;越可能發(fā)生的事件發(fā)生了,我們獲取到的信息量就越小。那么信息量應(yīng)該和事件發(fā)生的概率有關(guān)。

          條件概率是機(jī)器學(xué)習(xí)模型的一種表現(xiàn)形式,應(yīng)用這一模型,對(duì)于給定的輸入X,得到各輸出類的概率,選擇最大概率的類為輸出類,如下圖:

          本文介紹基于條件概率分類的兩種模型算法:邏輯斯蒂(logistic)回歸與最大熵模型,其中,logistic回歸模型和最大熵模型分別是基于最大似然函數(shù)和熵來估計(jì)模型P(y|x)。公眾號(hào)已有l(wèi)ogistic回歸模型的文章介紹,本文重點(diǎn)分析最大熵模型算法。


          目錄


          1. 最大熵模型算法

          2. 最大熵模型例子

          3. 最大熵模型在信號(hào)檢測的應(yīng)用

          4. logsitic回歸模型算法

          5. 總結(jié)


          1.最大熵模型算法




          熵是衡量隨機(jī)變量不確定性的指標(biāo),熵越大,隨機(jī)變量的不確定性亦越大。假設(shè)X是一個(gè)離散型隨機(jī)變量,其概率分布為:

          隨機(jī)變量X的熵定義為:

          熵滿足下列不等式:

          式中,|X|是x的取值個(gè)數(shù),當(dāng)且僅當(dāng)X的分布是均勻分布時(shí),右邊的等號(hào)成立,也就是說,當(dāng)X服從均勻分布時(shí),熵最大。


          1.1 最大熵模型的定義


          最大熵原理是概率模型學(xué)習(xí)的一個(gè)準(zhǔn)則,最大熵原理認(rèn)為,學(xué)習(xí)概率模型時(shí),在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。條件概率是機(jī)器學(xué)習(xí)模型的一種表現(xiàn)形式,學(xué)習(xí)該模型的一種方法是最大化該條件概率的熵 ,即最大化下式:


          其中表示變量X的經(jīng)驗(yàn)分布:

          其中v(X=x)表示訓(xùn)練數(shù)據(jù)中輸入x出現(xiàn)的頻數(shù),N表示樣本容量。

          (1)式的未知變量就是需要學(xué)習(xí)的模型。


          我們在構(gòu)建分類模型的過程中假設(shè)訓(xùn)練數(shù)據(jù)集的聯(lián)合概率分布與真實(shí)模型的聯(lián)合概率分布相等,這一假設(shè)用特征函數(shù)f(x,y)的期望來描述,特征函數(shù)的定義:


          特征函數(shù)f(x,y)關(guān)于訓(xùn)練數(shù)據(jù)集的聯(lián)合概率分布的期望值,用表示:


          其中,v(X=x,Y=y)表示訓(xùn)練數(shù)據(jù)中樣本(x,y)出現(xiàn)的頻數(shù)。


          征函數(shù)f(x,y)關(guān)于模型與經(jīng)驗(yàn)分布的期望值,用表示:


          假設(shè)兩者期望相等,即:




          結(jié)合(1)(4)式,得到最大熵模型:


          約束條件:



          1.2 最大熵模型的學(xué)習(xí)


          我們求解(5)式在約束條件下的最大值,其對(duì)應(yīng)的模型P(Y|X)就是所學(xué)習(xí)的最優(yōu)模型。

          對(duì)于給定的訓(xùn)練數(shù)據(jù)集以及特征函數(shù),i=1,2,...,n,最大熵模型的學(xué)習(xí)等價(jià)于約束最優(yōu)化問題:


          將最大值問題轉(zhuǎn)化為等價(jià)的求最小值問題:


          引入拉格朗日乘子將約束的最優(yōu)化問題轉(zhuǎn)換為無約束最優(yōu)化的對(duì)偶問題,通過求解對(duì)偶問題求解原始問題。

          定義拉格朗日函數(shù)L(P,w):


          最優(yōu)化的原始問題:


          對(duì)偶問題:

          得:

          由于,對(duì)上式進(jìn)行歸一化得:


          其中,

          易知是關(guān)于w的函數(shù),對(duì)偶問題外部的極大化問題:

          根據(jù)上式求解的代入(2.4)式,得到最終的學(xué)習(xí)模型P(y|x)。


          2. 最大熵模型例子




          假設(shè)隨機(jī)變量Y有5個(gè)取值,假設(shè)隨機(jī)變量Y的條件概率分布滿足如下條件:

          求最大熵模型對(duì)應(yīng)的概率分布P(Y)。

          最大熵模型的目標(biāo)函數(shù):

          引進(jìn)拉格朗日乘子,定義拉格朗日函數(shù):

          ,得:

          將上式代入函數(shù)L(P,w)得,令,得:

          于是最大熵模型對(duì)應(yīng)的概率分布

          3. 熵模型在信號(hào)檢測的應(yīng)用




          由第一節(jié)我們知道,熵是描述事物不確定性的指標(biāo)。我們將熵的這一性質(zhì)應(yīng)用在信號(hào)檢測領(lǐng)域,當(dāng)信號(hào)包含了較強(qiáng)的隨機(jī)噪聲時(shí)或被噪聲完全掩蓋時(shí),信號(hào)的隨機(jī)性大大的增加了,其對(duì)應(yīng)的熵也較大,根據(jù)這一原理對(duì)信號(hào)的質(zhì)量進(jìn)行檢測,下圖是用熵檢測心電信號(hào)質(zhì)量的效果圖:

          黑色表示較好的心電信號(hào)質(zhì)量,紅色表示較差的心電信號(hào)質(zhì)量。



          4. logistic回歸算法




          logistic回歸是一種概率分類模型,對(duì)于二分類任務(wù)來說,其條件概率分布:

          我們用最小化損失函數(shù)去估計(jì)上式的模型參數(shù)。對(duì)于給定的訓(xùn)練數(shù)據(jù)集,其中,。

          設(shè):

          似然函數(shù)為:

          對(duì)數(shù)似然函數(shù)為:

          損失函數(shù)為:

          用梯度下降法求解w的估計(jì)值

          代入(2.1)(2.2)式,得到邏輯斯蒂回歸模型P(y|x),其中向量包含了b值 。


          5. 小結(jié)




          本文介紹基于條件概率分類的兩種模型算法:logistic回歸模型與最大熵模型,其中,logistic回歸模型是基于最大似然函數(shù)估計(jì)模型P(y|x),最大熵模型是基于熵這一指標(biāo)估計(jì)模型P(y|x)。

           

          參考

          李航 《統(tǒng)計(jì)學(xué)習(xí)方法》


          END



          雙一流大學(xué)研究生團(tuán)隊(duì)創(chuàng)建,專注于目標(biāo)檢測與深度學(xué)習(xí),希望可以將分享變成一種習(xí)慣!

          整理不易,點(diǎn)贊鼓勵(lì)一下吧↓

          瀏覽 38
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久久久黄色视频 | 亚洲人成电影一区二区在线 | 免费躁逼淫片特级国产 | 特级欧美AAAAAA | 91亚洲国产成人久久精品麻豆 |