LeCun點(diǎn)贊華人女科學(xué)家——使用能量模型替代Softmax函數(shù)!

極市導(dǎo)讀
?本文證明了可以將任何預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的softmax置信度替換為能量函數(shù)!?>>明日直播!田值:實(shí)例分割創(chuàng)新式突破BoxInst,僅用Box標(biāo)注,實(shí)現(xiàn)COCO 33.2AP!
Softmax置信度得分應(yīng)該是大家再熟悉不過的加在神經(jīng)網(wǎng)絡(luò)最后面的一個(gè)操作。


1 論文一作

Sharon Yixuan Li,威斯康星大學(xué)麥迪遜分校計(jì)算機(jī)科學(xué)系助理教授,本科就讀于上海交通大學(xué),博士畢業(yè)于康奈爾大學(xué),博士后一年在斯坦福大學(xué)計(jì)算機(jī)系度過,曾兩次在Google AI實(shí)習(xí),并在Facebook AI擔(dān)任過研究科學(xué)家。
深度學(xué)習(xí)中的不確定性估計(jì)和分布外檢測(cè);
魯棒數(shù)據(jù)不規(guī)則性和分布外泛化;
在醫(yī)療和計(jì)算機(jī)視覺中具有不確定性的深度學(xué)習(xí)。
2 什么是能量模型(EBM)
?? ? ?
? ?
?對(duì)應(yīng)于第y類標(biāo)簽的logit值,聯(lián)立上式,可以將輸入
的能量值表示為負(fù)的
,這樣就在原始神經(jīng)網(wǎng)絡(luò)分類器和能量模型之間建立起了聯(lián)系,我們可以用softmax函數(shù)的分母來表示當(dāng)前輸入樣本的能量,并且進(jìn)行后續(xù)的異常檢測(cè)操作。
3 能量模型指導(dǎo)下的OOD
能量異常分?jǐn)?shù)

分母)在輸入空間很難可靠的估計(jì),但是其不會(huì)對(duì)輸入數(shù)據(jù)產(chǎn)生影響,所以可以直接對(duì)上式左右取對(duì)數(shù):
實(shí)際上與對(duì)數(shù)似然函數(shù)線性對(duì)齊,這有助于提高異常檢測(cè)的性能,具有較高能量(似然函數(shù)值較?。┑臄?shù)據(jù)會(huì)被判別為異常樣本。
?構(gòu)成異常檢測(cè)器
?:
為能量閾值,從正常樣本數(shù)據(jù)分布統(tǒng)計(jì)得到。能量分?jǐn)?shù) VS Softmax分?jǐn)?shù)

?傾向于得到一個(gè)較高的置信分?jǐn)?shù),這種傾向?qū)?dǎo)致評(píng)分函數(shù)不再與概率密度
成正比。
不受這類偏移影響,將始終與概率密度
對(duì)齊,進(jìn)而提高了模型對(duì)異常樣本的檢測(cè)能力。能量邊界學(xué)習(xí)


4?實(shí)驗(yàn)結(jié)果
Softmax對(duì)比實(shí)驗(yàn)


模型微調(diào)實(shí)驗(yàn)

5?總結(jié)
參考
推薦閱讀

評(píng)論
圖片
表情
