深入理解計(jì)算機(jī)視覺(jué)中的損失函數(shù)
點(diǎn)擊上方“AI算法與圖像處理”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
導(dǎo)讀
?損失函數(shù)在模型的性能中起著關(guān)鍵作用。選擇正確的損失函數(shù)可以幫助你的模型學(xué)習(xí)如何將注意力集中在數(shù)據(jù)中的正確特征集合上,從而獲得最優(yōu)和更快的收斂。

計(jì)算機(jī)視覺(jué)是計(jì)算機(jī)科學(xué)的一個(gè)領(lǐng)域,主要研究從數(shù)字圖像中自動(dòng)提取信息。
Pixel-wise損失函數(shù)
類(lèi)不平衡是像素級(jí)分類(lèi)任務(wù)中常見(jiàn)的問(wèn)題。當(dāng)圖像數(shù)據(jù)中的各種類(lèi)不平衡時(shí),就會(huì)出現(xiàn)這種情況。由于像素方面的損失是所有像素?fù)p失的平均值,因此訓(xùn)練會(huì)被分布最多的類(lèi)來(lái)主導(dǎo)。
Perceptual損失函數(shù)

Perceptual損失的數(shù)學(xué)表示
其中,表示VGG網(wǎng)絡(luò)第j層在處理圖像Y時(shí)的激活情況,其形狀為。我們使用L2損失的平方,根據(jù)圖像的形狀歸一化,比較了ground truth圖像Y和預(yù)測(cè)圖像Y^的激活情況。
如果你想使用VGG網(wǎng)絡(luò)的多個(gè)特征映射作為你的損失計(jì)算的一部分,只需為多個(gè)添加值。
內(nèi)容-風(fēng)格損失函數(shù)—神經(jīng)網(wǎng)絡(luò)風(fēng)格轉(zhuǎn)換

風(fēng)格轉(zhuǎn)換是將圖像的語(yǔ)義內(nèi)容轉(zhuǎn)換成不同風(fēng)格的過(guò)程。風(fēng)格轉(zhuǎn)換模型的目標(biāo)是,給定一個(gè)內(nèi)容圖像(C)和一個(gè)風(fēng)格圖像(S),生成包含C的內(nèi)容和S的風(fēng)格的輸出圖像。
內(nèi)容/風(fēng)格損失的數(shù)學(xué)表示
注意:只有減少樣式和內(nèi)容損失的優(yōu)化會(huì)導(dǎo)致高像素化和噪聲輸出。為了解決這個(gè)問(wèn)題,我們引入了total variation loss來(lái)保證生成的圖像的空間連續(xù)性和平滑性。
紋理?yè)p失
紋理?yè)p失的數(shù)學(xué)表示
網(wǎng)絡(luò)的紋理?yè)p失是所有紋理?yè)p失的加權(quán)和,表示為:
這里a是原始圖像,x是預(yù)測(cè)圖像。
注意:雖然這里的數(shù)學(xué)看起來(lái)有點(diǎn)復(fù)雜,但請(qǐng)理解紋理?yè)p失只是應(yīng)用在特征圖的gram矩陣上的感知損失。
拓?fù)涓兄獡p失函數(shù)

拓?fù)涓兄獡p失的數(shù)學(xué)表示
對(duì)比損失/三元組損失

重申一下,Siamese網(wǎng)絡(luò)的目標(biāo)是確保一個(gè)特定的人的圖像(錨點(diǎn))與同一個(gè)人的所有其他圖像(positive)的距離要比與任何其他人的圖像(negative)的距離更近。
定義距離度量d=L2范數(shù) 計(jì)算anchor圖像與positive圖像的嵌入距離=d(a, p) 計(jì)算anchor圖像嵌入到negative圖像的距離=d(a, n) 三元組損失= d(a, p) - d(a, n) + offset
三元組的數(shù)學(xué)表示
GAN損失
由Ian Goodfellow等人(https://arxiv.org/abs/1406.2661)(2014)首先提出的生成式對(duì)抗網(wǎng)絡(luò)是目前最流行的圖像生成任務(wù)解決方案。GANs的靈感來(lái)自博弈論,并使用一個(gè)對(duì)抗的方案,使它可以用無(wú)監(jiān)督的方式訓(xùn)練。
1. Min-Max損失函數(shù)
2. 不飽和的GAN損失
3. 最小均方GAN損失
4. Wasserstein GAN損失
5. 循環(huán)一致性損失

圖像到圖像的轉(zhuǎn)換是一個(gè)圖像合成的任務(wù),需要對(duì)給定的圖像進(jìn)行有控制的修改,生成一個(gè)新的圖像。例如,把馬轉(zhuǎn)換成斑馬(或反過(guò)來(lái)),把繪畫(huà)轉(zhuǎn)換成照片(或反過(guò)來(lái)),等等。
循環(huán)一致性是指第一個(gè)生成器輸出的圖像可以用作第二個(gè)生成器的輸入,而第二個(gè)生成器的輸出應(yīng)該與原始圖像匹配。反之亦然。
下載1:OpenCV黑魔法
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):OpenCV黑魔法,即可下載小編精心編寫(xiě)整理的計(jì)算機(jī)視覺(jué)趣味實(shí)戰(zhàn)教程
下載2 CVPR2020 在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):CVPR2020,即可下載1467篇CVPR?2020論文 個(gè)人微信(如果沒(méi)有備注不拉群!) 請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱(chēng)
覺(jué)得有趣就點(diǎn)亮在看吧

評(píng)論
圖片
表情

