ICML 2021 (Long Oral) | 深入研究不平衡回歸問(wèn)題
點(diǎn)擊上方“視學(xué)算法”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
導(dǎo)讀
本文介紹了一篇被ICML2021接收的工作:Long oral presentation:Delving into Deep Imbalanced Regression。該工作推廣了傳統(tǒng)不平衡分類問(wèn)題的范式,將數(shù)據(jù)不平衡問(wèn)題從離散值域推廣到連續(xù)域。

我們提出了一個(gè)新的任務(wù),稱為深度不平衡回歸(Deep Imbalanced Regression,簡(jiǎn)寫(xiě)為DIR)。DIR任務(wù)定義為從具有連續(xù)目標(biāo)的不平衡數(shù)據(jù)中學(xué)習(xí),并能泛化到整個(gè)目標(biāo)范圍; 我們同時(shí)提出了針對(duì)不平衡回歸的新的方法,標(biāo)簽分布平滑(label distribution smoothing, LDS)和特征分布平滑(feature distribution smoothing, FDS),以解決具有連續(xù)目標(biāo)的不平衡數(shù)據(jù)的學(xué)習(xí)問(wèn)題; 最后我們建立了五個(gè)新的DIR數(shù)據(jù)集,涵蓋了computer vision,NLP,和healthcare上的不平衡回歸任務(wù),來(lái)方便未來(lái)在不平衡數(shù)據(jù)上的研究。
1. 研究背景與動(dòng)機(jī)




2. 不平衡回歸的難點(diǎn)與挑戰(zhàn)


3. 標(biāo)簽分布平滑(LDS)



4. 特征分布平滑(FDS)



5. 基準(zhǔn)DIR數(shù)據(jù)集及實(shí)驗(yàn)分析

IMDB-WIKI-DIR(vision, age): 從包含人面部的圖像來(lái)推斷估計(jì)相應(yīng)的年齡。基于IMDB-WIKI[9]數(shù)據(jù)集,我們手動(dòng)構(gòu)建了驗(yàn)證集和測(cè)試集,使其保持了分布的平衡。 AgeDB-DIR(vision, age): 同樣是根據(jù)單個(gè)輸入圖像進(jìn)行年齡估算,基于AgeDB[11]數(shù)據(jù)集。注意到與IMDB-WIKI-DIR相比,即使兩個(gè)數(shù)據(jù)集是完全相同的task,他們的標(biāo)簽分布的不平衡也不相同。 NYUD2-DIR(vision, depth): 除了single value的prediction, 我們還基于NYU2數(shù)據(jù)集[12]構(gòu)建了進(jìn)行depth estimation的DIR任務(wù),是一個(gè)dense value prediction的任務(wù)。我們構(gòu)建了NYUD2-DIR數(shù)據(jù)集來(lái)進(jìn)行不平衡回歸的評(píng)估。 STS-B-DIR(NLP, text similarity score): 我們還在NLP領(lǐng)域中構(gòu)建了一個(gè)叫STS-B-DIR的DIR benchmark,基于STS-B數(shù)據(jù)集[13]。他的任務(wù)是推斷兩個(gè)輸入句子之間的語(yǔ)義文本的相似度得分。這個(gè)相似度分?jǐn)?shù)是連續(xù)的,范圍是0到5,并且分布不平衡。 SHHS-DIR(Healthcare, health condition score): 最后,我們?cè)趆ealthcare領(lǐng)域也構(gòu)建了一個(gè)DIR的benchmark,叫做 SHHS-DIR,基于SHHS數(shù)據(jù)集[14]。這項(xiàng)任務(wù)是推斷一個(gè)人的總體健康評(píng)分,該評(píng)分在0到100之間連續(xù)分布,評(píng)分越高則健康狀況越好。網(wǎng)絡(luò)的輸入是每個(gè)患者在一整晚睡眠過(guò)程中的高維PSG信號(hào),包括ECG心電信號(hào),EEG腦電信號(hào),以及他的呼吸信號(hào)。很明顯可以看到,總體健康分?jǐn)?shù)的分布也是極度不平衡的,并存在一定的target value是沒(méi)有數(shù)據(jù)的。



6. 結(jié)語(yǔ)
參考
本文亮點(diǎn)總結(jié)
如果覺(jué)得有用,就請(qǐng)分享到朋友圈吧!

點(diǎn)個(gè)在看 paper不斷!
評(píng)論
圖片
表情
