無需多個(gè)模型也能實(shí)現(xiàn)知識(shí)整合?港中文MMLab提出「烘焙」算法,全面提升ImageNet性能
來自港中文 MMLab 的研究者提出一種烘焙(BAKE)算法,為知識(shí)蒸餾中的知識(shí)整合提供了一個(gè)全新的思路,打破了固有的多模型整合的樣式,創(chuàng)新地提出并嘗試了樣本間的知識(shí)整合。

論文鏈接:https://arxiv.org/pdf/2104.13298.pdf
項(xiàng)目主頁:https://geyixiao.com/projects/bake
代碼鏈接:https://github.com/yxgeee/BAKE



,也就是同一樣本的相似度,并在每行進(jìn)行 softmax 歸一化,使得每一行的和為 1,即
。基于親和度矩陣 A,可以對(duì)除錨樣本之外的其他樣本的預(yù)測進(jìn)行加權(quán)傳播,
。并與錨樣本本身的預(yù)測概率進(jìn)行加權(quán)和,從而獲得軟標(biāo)簽作為蒸餾目標(biāo)
。研究者利用近似預(yù)測對(duì)傳播無限次后的軟標(biāo)簽進(jìn)行了估計(jì),
。




? THE END
轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)獲得授權(quán)
投稿或?qū)で髨?bào)道:[email protected]

點(diǎn)個(gè)在看 paper不斷!
評(píng)論
圖片
表情
