深入理解計(jì)算機(jī)視覺中的損失函數(shù)

極市導(dǎo)讀
?損失函數(shù)在模型的性能中起著關(guān)鍵作用。選擇正確的損失函數(shù)可以幫助你的模型學(xué)習(xí)如何將注意力集中在數(shù)據(jù)中的正確特征集合上,從而獲得最優(yōu)和更快的收斂。

計(jì)算機(jī)視覺是計(jì)算機(jī)科學(xué)的一個(gè)領(lǐng)域,主要研究從數(shù)字圖像中自動(dòng)提取信息。
Pixel-wise損失函數(shù)
類不平衡是像素級(jí)分類任務(wù)中常見的問題。當(dāng)圖像數(shù)據(jù)中的各種類不平衡時(shí),就會(huì)出現(xiàn)這種情況。由于像素方面的損失是所有像素?fù)p失的平均值,因此訓(xùn)練會(huì)被分布最多的類來主導(dǎo)。
Perceptual損失函數(shù)

Perceptual損失的數(shù)學(xué)表示
其中,表示VGG網(wǎng)絡(luò)第j層在處理圖像Y時(shí)的激活情況,其形狀為。我們使用L2損失的平方,根據(jù)圖像的形狀歸一化,比較了ground truth圖像Y和預(yù)測(cè)圖像Y^的激活情況。
如果你想使用VGG網(wǎng)絡(luò)的多個(gè)特征映射作為你的損失計(jì)算的一部分,只需為多個(gè)添加值。
內(nèi)容-風(fēng)格損失函數(shù)—神經(jīng)網(wǎng)絡(luò)風(fēng)格轉(zhuǎn)換

風(fēng)格轉(zhuǎn)換是將圖像的語義內(nèi)容轉(zhuǎn)換成不同風(fēng)格的過程。風(fēng)格轉(zhuǎn)換模型的目標(biāo)是,給定一個(gè)內(nèi)容圖像(C)和一個(gè)風(fēng)格圖像(S),生成包含C的內(nèi)容和S的風(fēng)格的輸出圖像。
內(nèi)容/風(fēng)格損失的數(shù)學(xué)表示
注意:只有減少樣式和內(nèi)容損失的優(yōu)化會(huì)導(dǎo)致高像素化和噪聲輸出。為了解決這個(gè)問題,我們引入了total variation loss來保證生成的圖像的空間連續(xù)性和平滑性。
紋理損失
紋理損失的數(shù)學(xué)表示
網(wǎng)絡(luò)的紋理損失是所有紋理損失的加權(quán)和,表示為:
這里a是原始圖像,x是預(yù)測(cè)圖像。
注意:雖然這里的數(shù)學(xué)看起來有點(diǎn)復(fù)雜,但請(qǐng)理解紋理損失只是應(yīng)用在特征圖的gram矩陣上的感知損失。
拓?fù)涓兄獡p失函數(shù)

拓?fù)涓兄獡p失的數(shù)學(xué)表示
對(duì)比損失/三元組損失

重申一下,Siamese網(wǎng)絡(luò)的目標(biāo)是確保一個(gè)特定的人的圖像(錨點(diǎn))與同一個(gè)人的所有其他圖像(positive)的距離要比與任何其他人的圖像(negative)的距離更近。
定義距離度量d=L2范數(shù) 計(jì)算anchor圖像與positive圖像的嵌入距離=d(a, p) 計(jì)算anchor圖像嵌入到negative圖像的距離=d(a, n) 三元組損失= d(a, p) - d(a, n) + offset
三元組的數(shù)學(xué)表示
GAN損失
由Ian Goodfellow等人(https://arxiv.org/abs/1406.2661)(2014)首先提出的生成式對(duì)抗網(wǎng)絡(luò)是目前最流行的圖像生成任務(wù)解決方案。GANs的靈感來自博弈論,并使用一個(gè)對(duì)抗的方案,使它可以用無監(jiān)督的方式訓(xùn)練。
1. Min-Max損失函數(shù)
2. 不飽和的GAN損失
3. 最小均方GAN損失
4. Wasserstein GAN損失
5. 循環(huán)一致性損失

圖像到圖像的轉(zhuǎn)換是一個(gè)圖像合成的任務(wù),需要對(duì)給定的圖像進(jìn)行有控制的修改,生成一個(gè)新的圖像。例如,把馬轉(zhuǎn)換成斑馬(或反過來),把繪畫轉(zhuǎn)換成照片(或反過來),等等。
循環(huán)一致性是指第一個(gè)生成器輸出的圖像可以用作第二個(gè)生成器的輸入,而第二個(gè)生成器的輸出應(yīng)該與原始圖像匹配。反之亦然。
推薦閱讀
最牛損失函數(shù)解讀: A General and Adaptive Robust Loss Function
損失函數(shù)的可視化:淺論模型的參數(shù)空間與正則
PIoU Loss:傾斜目標(biāo)檢測(cè)專用損失函數(shù),公開超難傾斜目標(biāo)數(shù)據(jù)集Retail50K丨ECCV 2020 Spotlight
ACCV 2020國(guó)際細(xì)粒度網(wǎng)絡(luò)圖像識(shí)別競(jìng)賽正式開賽!
△長(zhǎng)按添加極市小助手
△長(zhǎng)按關(guān)注極市平臺(tái),獲取最新CV干貨
覺得有用麻煩給個(gè)在看啦~??
評(píng)論
圖片
表情
