IoU-aware的目標(biāo)檢測,顯著提高定位精度
點擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達
今天新出的一篇論文IoU-aware Single-stage Object Detector for Accurate Localization,提出一種非常簡單的目標(biāo)檢測定位改進方法,通過預(yù)測目標(biāo)候選包圍框與真實目標(biāo)標(biāo)注的IoU(交并比),并基于此與分類分數(shù)的乘積作為檢測置信度,用于NMS(非極大抑制)和COCO AP計算,顯著提高了目標(biāo)檢測的定位精度。
該文作者信息:

作者均來自華中科技大學(xué)。
在目標(biāo)檢測問題中,模型需要輸出目標(biāo)分類分數(shù)和與其對應(yīng)的目標(biāo)定位的包圍框,在以往的模型中,經(jīng)常使用分類分數(shù)作為目標(biāo)定位準不準的置信度,并基于此對大量候選目標(biāo)包圍框NMS,現(xiàn)在越來越多的工作發(fā)現(xiàn),分類分數(shù)高并不能保證定位精度高。
作者認為IoU是直接反應(yīng)定位準不準的直接指標(biāo),可以在目標(biāo)檢測模型的分類和定位任務(wù)的基礎(chǔ)上添加IoU預(yù)測的任務(wù),可以在一定程度上反應(yīng)定位置信度。
作者是在著明的一階段目標(biāo)檢測算法RetinaNet基礎(chǔ)上做的改進,如下圖:

在包圍框回歸分支添加一個并行的預(yù)測IoU的任務(wù)。
相關(guān)的損失函數(shù)數(shù)學(xué)描述:

作者將分類分數(shù)和預(yù)測得到的IoU相乘,這個指標(biāo)既反應(yīng)了是不是這個目標(biāo),又反應(yīng)了該位置和真實目標(biāo)的可能的交并比,認為它是更加精確的檢測置信度:

公式中參數(shù) α 用于控制兩者的貢獻大小。
作者在COCO test-dev上與其他State-of-the-art算法的結(jié)果比較:

可見,相比于基線RetinaNet,取得了顯著的AP提升,提升在1.0%~1.6%之間。
在PASCAL VOC數(shù)據(jù)集上與RetinaNet的比較結(jié)果:

同樣取得了顯著的AP提升,AP 提升在1.1%~2.2%之間。
這篇文章盡管思路比較簡單,但改進還是明顯的,希望對其他目標(biāo)檢測算法也有效,期待有更多實驗結(jié)果出來。
論文地址:
https://arxiv.org/pdf/1912.05992.pdf
作者稱代碼將開源,不過還沒公布地址。
小白團隊出品:零基礎(chǔ)精通語義分割↓↓↓
下載1:OpenCV-Contrib擴展模塊中文版教程 在「小白學(xué)視覺」公眾號后臺回復(fù):擴展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。 下載2:Python視覺實戰(zhàn)項目52講 在「小白學(xué)視覺」公眾號后臺回復(fù):Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學(xué)校計算機視覺。 下載3:OpenCV實戰(zhàn)項目20講 在「小白學(xué)視覺」公眾號后臺回復(fù):OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學(xué)習(xí)進階。 交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~


