? ?作者：晟沚 ? ? ? ??

? ? ? ??

前 ?言

? ?

本文主要推薦一篇使用GAN來做語義分割的論文。?
論文名稱: SemanticSegmentationusingAdversarialNetworks 、

論文鏈接:?https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1611.08408.pdf?

????目前，對抗學(xué)習(xí)的方法生成圖像已經(jīng)有比較好的效果，在這篇論文中，作者提出了一種使用對抗訓(xùn)練方法來訓(xùn)練語義分割模型。同時訓(xùn)練卷積語義分割網(wǎng)絡(luò)以及對抗網(wǎng)絡(luò)，具體做法是在GAN的Generator中使用語義分割的網(wǎng)絡(luò)，Generator輸入原圖，輸出預(yù)測的分割圖，Discriminator再對抗學(xué)習(xí)，區(qū)分GroundTruth和Generator生成的預(yù)測分割圖。而使用GAN有什么意義呢？論文作者提出采用這樣的方法可以檢測和糾正分割預(yù)測圖與GroundTruth的higher-order不一致性。

對抗學(xué)習(xí)

????作者使用兩個loss來監(jiān)督。第一個是多個類別的交叉熵?fù)p失，這個loss主要是監(jiān)督每個像素都能預(yù)測出正確的類別。第二個loss基于輔助對抗卷積網(wǎng)絡(luò),由于對抗卷積網(wǎng)絡(luò)的視野要么是整個圖像，要么是圖像的很大一部分，因此higher-order label統(tǒng)計中的不匹配會受到對抗性損失的懲罰,這個是按照像素進(jìn)行分類無法實(shí)現(xiàn)的（例如，用某類標(biāo)記的像素區(qū)域的形狀，或某類區(qū)域中的像素分?jǐn)?shù)是否超過閾值）功能。?
????作者使用s（x）表示在給定大小為HxWx3的輸入RGB圖像x的情況下，分割模型生成的C個大小為HxWxC的類的類概率圖。使用a（x，y）來表示輸入是x時，對抗模型預(yù)測y是GroundTruth的概率，而不是由分割模型s（ ·）預(yù)測的輸出。給定N個訓(xùn)練圖像xn的數(shù)據(jù)集和相應(yīng)的標(biāo)簽yn，將損失定義為如下圖：?

????訓(xùn)練對抗模型主要是優(yōu)化第二個損失，即下圖的二進(jìn)制分類損失：?

????訓(xùn)練分割模型主要是減少多個類別的交叉熵?fù)p失，同時降低對抗模型的性能，使得分割模型生成的預(yù)測圖對于Discriminator來說，很難將其與GroundTruth區(qū)分，相關(guān)的損失函數(shù)如下所示：?

網(wǎng)絡(luò)結(jié)構(gòu)

????作者對于Stanford Background dataset和Pascal VOC 2012 dataset這兩個數(shù)據(jù)集分別采用了不同的分割網(wǎng)絡(luò)。其中對抗網(wǎng)絡(luò)的思想如下圖，首先分割網(wǎng)絡(luò)將RGB圖像作為輸入，并生成每個像素的類別預(yù)測，然后對抗網(wǎng)絡(luò)將GroundTruth作為輸入并生成類標(biāo)簽（1 =GroundTruth，或0 =合成）。?
點(diǎn)擊查看大圖

實(shí)驗結(jié)果

????在下圖，作者給出了使用和不使用對抗訓(xùn)練的情況下使用此網(wǎng)絡(luò)生成的分割結(jié)果。對抗訓(xùn)練可以更好地加強(qiáng)類別標(biāo)簽之間的空間一致性。它可以改善和強(qiáng)化大面積類別的概率，例如概率圖描繪了天空和草叢，但也銳化了階級界限，并在小范圍內(nèi)刪除了錯誤預(yù)測的類別標(biāo)簽。?
?
????在兩個數(shù)據(jù)集上的結(jié)果如下兩表：?
?
點(diǎn)擊查看大圖

END

機(jī)器學(xué)習(xí)算法工程師

? ??? ? ? ? ? ? ? ? ? ? ? ??????????????????一個用心的公眾號

你了解如何用GAN做語義分割嗎

對抗學(xué)習(xí)

網(wǎng)絡(luò)結(jié)構(gòu)

實(shí)驗結(jié)果