想學圖像分割,強烈建議從這5篇圖像分割算法綜述
點擊上方“AI算法與圖像處理”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
引言
綜述一
【1】使用深度學習進行圖像分割:綜述
標題:Image Segmentation Using Deep Learning: A Survey
作者:Shervin Minaee, Demetri Terzopoulos
鏈接:https://arxiv.org/abs/2001.05566
本文梳理了172篇相關文獻。
最近,由于深度學習模型在各種視覺應用中的成功,已經有大量旨在利用深度學習模型開發(fā)圖像分割方法的工作。本文提供了對文獻的全面回顧,涵蓋了語義和實例級分割的眾多開創(chuàng)性作品,包括全卷積像素標記網絡,編碼器-解碼器體系結構,多尺度以及基于金字塔的方法,遞歸網絡,視覺注意模型和對抗環(huán)境中的生成模型。本文研究了這些深度學習模型的相似性,優(yōu)勢和挑戰(zhàn),研究了使用最廣泛的數(shù)據集,報告了性能,并討論了該領域有希望的未來研究方向。
2014年至2020年基于DL的2D圖像分割算法的時間軸。橙色,綠色和黃色塊分別表示語義,實例和全景分割算法。
DeepLabV3在樣本圖像上的分割結果。
U-net模型。藍色框表示具有其指定形狀的要素地圖塊。
DeepLabv3 +模型。
以mIoU和平均準確度(mAcc)表示,NYUD-v2和SUN-RGBD數(shù)據集上的分割模型的性能。
綜述二
【2】 A Survey on Deep Learning Methods for Semantic Image Segmentation in Real-Time
標題:深度學習實時語義圖像分割方法綜述
作者:Georgios Takos
鏈接:https://arxiv.org/abs/2009.12942
本文共梳理了9篇相關文獻。
語義圖像分割是計算機視覺中增長最快的領域之一,具有多種應用程序。在許多領域,例如機器人技術和自動駕駛汽車,語義圖像分割至關重要,因為語義分割為基于像素級別的場景理解提供了采取動作所需的必要上下文。此外,醫(yī)學診斷和治療的成功取決于對所考慮數(shù)據的極其準確的理解,并且語義圖像分割是許多情況下的重要工具之一。深度學習的最新發(fā)展提供了許多工具來有效地解決這一問題,并且提高了準確性。這項工作對圖像分割中的最新深度學習體系結構進行了全面分析,更重要的是,它提供了廣泛的技術列表以實現(xiàn)快速推理和計算效率。
完全卷積網絡架構:

DeconvNet體系結構:

比例感知語義圖像分割架構:

Cityscapes像素級語義標簽任務最佳表現(xiàn)模型:


綜述三
【3】Unsupervised Domain Adaptation in Semantic Segmentation: a Review
標題:語義分割中的無監(jiān)督自適應研究進展
作者:Marco Toldo, ?Pietro Zanuttigh
鏈接:https://arxiv.org/abs/2005.10876
本文共梳理了120篇相關文獻。
本文的目的是概述用于語義分割的深度網絡的無監(jiān)督域自適應(UDA)的最新進展。這項任務引起了廣泛的興趣,因為語義分割模型需要大量的標記數(shù)據,而缺乏適合特定要求的數(shù)據是部署這些技術的主要限制。
最受歡迎的用于語義分割的UDA策略的維恩圖。每種方法都屬于代表使用的自適應技術的集合。
從分類(稀疏任務)到語義分割(密集任務)的一些樣本圖像上一些可能的視覺任務的概述。
可以在不同的空間執(zhí)行域移位自適應:輸入級別,功能級別和輸出級別。
綜述四
【4】A survey of loss functions for semantic segmentation
標題:語義分割損失函數(shù)綜述
作者:Shruti Jadon
鏈接:https://arxiv.org/abs/2006.14822
本文共梳理了23篇相關文獻。
本文總結了一些眾所周知的損失函數(shù),這些函數(shù)廣泛用于圖像分割,并列出了使用它們可以幫助快速,更好地收斂模型的情況。此外,本文還引入了新的log-cosh骰子損失函數(shù),并將其在NBFS頭骨分割開源數(shù)據集上的性能與廣泛使用的損失函數(shù)進行了比較。?本文還展示了某些損失函數(shù)在所有數(shù)據集上都能很好地發(fā)揮作用,并且在未知的數(shù)據分發(fā)方案中可以被視為很好的基準選擇。
語義分割損失函數(shù)的類型
二元交叉熵損失函數(shù)圖。在這里,熵在Y軸上定義,事件的概率在X軸上。
語義分割損失函數(shù)的附表。
綜述五
【5】A Survey on Instance Segmentation: State of the art
標題:實例分割技術綜述
作者:Abdul Mueed Hafiz, Ghulam Mohiuddin Bhat
鏈接:https://arxiv.org/abs/2007.00047
本文共梳理143篇相關文章,由克什米爾大學的學者發(fā)布。
目標檢測或定位是從粗略到精細的數(shù)字圖像推斷的增量步驟。它不僅提供圖像對象的類別,而且還提供已分類圖像對象的位置。該位置以邊界框或質心的形式給出。語義分割可通過預測輸入圖像中每個像素的標簽來進行精細推斷。每個像素根據其所在的對象類別進行標記。為進一步發(fā)展,實例分割為屬于同一類的對象的單獨實例提供了不同的標簽。因此,實例分割可以被定義為同時解決對象檢測和語義分割問題的技術。在這份關于實例分割的調查論文中,討論了實例分割的背景,問題,技術,演變,流行的數(shù)據集,相關技術以及最新范圍。本文為那些希望在實例分割領域進行研究的人提供了寶貴的信息。
對象識別的演變:從粗略推斷到細粒度推斷:(a)圖像分類,(b)對象檢測或定位,(c)實例分割,(d)語義分割。
實例分割中重要技術的時間表
下圖為PANet框架。(a)FPN主干。(b)自下而上的路徑擴充。(c)自適應功能池。(d)盒支。(e)全連接融合。

Microsoft COCO數(shù)據集上值得注意的實例分割工作
個人微信(如果沒有備注不拉群!) 請注明:地區(qū)+學校/企業(yè)+研究方向+昵稱
下載1:何愷明頂會分享
在「AI算法與圖像處理」公眾號后臺回復:何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經典工作的總結分析
下載2:終身受益的編程指南:Google編程風格指南
在「AI算法與圖像處理」公眾號后臺回復:c++,即可下載。歷經十年考驗,最權威的編程規(guī)范!
下載3 CVPR2020 在「AI算法與圖像處理」公眾號后臺回復:CVPR2020,即可下載1467篇CVPR?2020論文
覺得不錯就點亮在看吧

