新目標(biāo)檢測框架 | 基于改進(jìn)的one-shot的目標(biāo)檢測
點(diǎn)擊下方“AI算法與圖像處理”,一起進(jìn)步!
重磅干貨,第一時(shí)間送達(dá)
目前在目標(biāo)檢測方面的進(jìn)展依賴于大規(guī)模的數(shù)據(jù)集來獲得良好的性能。然而,在許多場景下可能并不總是有足夠的樣本,從而導(dǎo)致當(dāng)前基于深度學(xué)習(xí)的目標(biāo)檢測模型的性能下降。


由于這兩種方法的基本相似性,結(jié)果表明,這兩種方法通過將新類的support圖像作為條件處理,可以與條件目標(biāo)檢測模型相等。
然后,研究者就提出了將檢測問題更好地命名為one-shot條件目標(biāo)檢測。并設(shè)計(jì)了一個(gè)基于可學(xué)習(xí)度量和two-stages檢測模型的通用one-shot條件目標(biāo)檢測框架(OSCD),如上圖(c)。
條件目標(biāo)檢測與目標(biāo)檢測之間存在一些區(qū)別。
首先,他們有不同的目標(biāo)。條件目標(biāo)檢測的目的是檢測與測試圖像中給定的條件圖像相似的對象。因此,條件目標(biāo)檢測可以檢測到屬于不可見類別的對象。而目標(biāo)檢測是檢測所有屬于訓(xùn)練類別的對象,不能檢測看不見類對象;其次,這兩種方法有不同的訓(xùn)練方式。條件目標(biāo)檢測的訓(xùn)練是基于support和query圖像對。而目標(biāo)檢測是標(biāo)準(zhǔn)的監(jiān)督學(xué)習(xí),并有足夠的訓(xùn)練樣本;第三,這兩種方法有不同的評價(jià)標(biāo)準(zhǔn),在各種support和query圖像對上評估了條件目標(biāo)檢測模型,而目標(biāo)檢測模型則在許多檢測圖像上進(jìn)行了評估。

在one-shot條件目標(biāo)檢測的設(shè)置中,數(shù)據(jù)通常成對組織,由support和query圖像組成。support圖像通常包含一個(gè)主導(dǎo)的目標(biāo)對象(人或馬),并且模型應(yīng)該能夠在query圖像中檢測到屬于目標(biāo)對象類別的對象。

對于目標(biāo)檢測,假設(shè)在感興趣的類中沒有足夠的樣本,從而導(dǎo)致公共監(jiān)督學(xué)習(xí)方法的性能較差。此外,我們可能不知道在未來的任務(wù)中存在哪些類別。更嚴(yán)重的挑戰(zhàn)是,“目標(biāo)”可以是任何令人感興趣的模式。所有這些問題都使得目標(biāo)檢測任務(wù)對傳統(tǒng)方法來說極其困難。因此,提出了one-shot的條件目標(biāo)檢測方法來解決上述問題。
如下圖所示。One-shot條件檢測的目標(biāo)是根據(jù)查詢圖像中的給定條件(目標(biāo)對象的單個(gè)支持圖像)來檢測對象。在one-shot條件檢測的情況下,在許多支持查詢的可見類圖像對上訓(xùn)練一個(gè)模型,以獲得強(qiáng)先驗(yàn)。一旦訓(xùn)練,模型可以從具有單一支持圖像的看不見類中檢測屬于目標(biāo)類別的所有對象。


上圖,(a)C-RPN:S操作連接全局平均和最大池support features,并通過卷積層生成顯著support features,然后T平鋪突出support features使平鋪support features具有與query features相同的空間大小,因此F可以連接平鋪support features來查詢特征。C1、C2是兩個(gè)卷積層。(b)C-Detector:從C-RPN中選擇候選區(qū)域的query features,然后將它們與support features結(jié)合起來。R表示調(diào)整大小的操作,F(xiàn)表示深度上的連接。可學(xué)習(xí)的度量模塊由一個(gè)用于降維的卷積層和兩個(gè)用于檢測的全連接層組成。


?(b) Examples for the Fashion-OSCD dataset. Green boxes denote?ground truth bounding boxes. Each image contains as much as 3 objects with?multiple scales and aspect ratios.





交流群
歡迎加入公眾號讀者群一起和同行交流,目前有美顏、三維視覺、計(jì)算攝影、檢測、分割、識(shí)別、NeRF、GAN、算法競賽等微信群
個(gè)人微信(如果沒有備注不拉群!) 請注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱
下載1:何愷明頂會(huì)分享
在「AI算法與圖像處理」公眾號后臺(tái)回復(fù):何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經(jīng)典工作的總結(jié)分析
下載2:終身受益的編程指南:Google編程風(fēng)格指南
在「AI算法與圖像處理」公眾號后臺(tái)回復(fù):c++,即可下載。歷經(jīng)十年考驗(yàn),最權(quán)威的編程規(guī)范!
下載3 CVPR2021 在「AI算法與圖像處理」公眾號后臺(tái)回復(fù):CVPR,即可下載1467篇CVPR?2020論文 和 CVPR 2021 最新論文

