<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          43.6% mAP! 阿里巴巴提出:用于一階段目標(biāo)檢測的半錨式檢測器

          共 2820字,需瀏覽 6分鐘

           ·

          2020-09-18 09:28

          點(diǎn)擊上方AI算法與圖像處理”,選擇加"星標(biāo)"或“置頂”

          重磅干貨,第一時(shí)間送達(dá)

          來源:AI深度學(xué)習(xí)視線


          半錨式(semi-anchored,SA)目標(biāo)檢測器,其基于ResNet-101 可在COCO上可達(dá)43.6% mAP!性能優(yōu)于FreeAnchor、FCOS和FSAF等.

          作者:阿里巴巴

          paper:

          https://arxiv.org/abs/2009.04989



          1


          摘要



          標(biāo)準(zhǔn)的一階段檢測器包括兩個(gè)任務(wù):分類和回歸。為特征圖中的每個(gè)位置引入了不同形狀的錨(anchor),以減輕多尺度目標(biāo)回歸的挑戰(zhàn)。但是,由于anchor中高度的類不平衡問題,分類的性能可能會(huì)降低。最近,提出了許多anchor-free算法來直接對(duì)位置進(jìn)行分類。anchor-free策略有利于分類任務(wù),但由于缺少先驗(yàn)的邊界框,可能導(dǎo)致回歸不到最優(yōu)值。在這項(xiàng)工作中,我們提出了一個(gè)半錨式(semi-anchored)框架。具體而言,我們?cè)诜诸愔写_定正位置,并將多個(gè)anchors與回歸中的正位置關(guān)聯(lián)。以ResNet-101為骨干,提出中的semi-anchored檢測器在COCO數(shù)據(jù)集上達(dá)到了43.6%的mAP,這證明了一階段檢測器的最新性能。


          2


          本文思想


          本文提出了一種用于單級(jí)目標(biāo)檢測的半錨定檢測器。具體來說,我們?cè)跊]有錨的情況下對(duì)feature map中的位置進(jìn)行分類。在分類中,我們可以將錨點(diǎn)的正候選點(diǎn)與負(fù)候選點(diǎn)的比率從1:1400提高到位置的1:200。對(duì)于回歸,我們?yōu)槊總€(gè)位置關(guān)聯(lián)多個(gè)錨點(diǎn),并從錨點(diǎn)學(xué)習(xí)前景位置的邊界框。主要的挑戰(zhàn)之一是計(jì)算以前景位置為中心的錨點(diǎn)的前景/背景概率,因?yàn)殄^點(diǎn)沒有用于分類。這些錨具具有相同的定位性能,但由于錨具的形狀不同,性能可能不盡人意。因此,我們附加一個(gè)錨分類頭來識(shí)別每個(gè)位置的前景錨。圖1說明了所提出的半錨定檢測器的過程。

          顯然,所提出的檢測器在沒有錨的情況下處理了平衡分類問題,并且在有錨的情況下獲得了更好的回歸性能。此外,我們還根據(jù)回歸后的并集相交(IoU)定義了正錨。與傳統(tǒng)回歸前用IoU標(biāo)記錨點(diǎn)的算法相比,該策略更符合目標(biāo)。簡化了分類頭,提高了分類效率。在COCO數(shù)據(jù)集上的大量實(shí)驗(yàn)(Lin et al. 2014)驗(yàn)證了所提框架的有效性和效率。我們的算法可以超過目前最先進(jìn)的無錨檢測器FCOS (Tian et al. 2019),以ResNet-101為骨干實(shí)現(xiàn)mAP 43.6%。此外,當(dāng)我們?yōu)槊總€(gè)位置分配更多的錨時(shí),該方法的推理時(shí)間甚至小于RetinaNet。


          3


          具體實(shí)現(xiàn)


          3.1 Location Classification

          在分類任務(wù)中,我們?cè)跊]有錨的情況下從特征圖中識(shí)別前景位置。一個(gè)位置是指feature map中的一個(gè)像素。設(shè){x i, y i}表示位置集,其中xi為特征,yi表示第i個(gè)位置的標(biāo)號(hào)。對(duì)于C個(gè)前景對(duì)象的問題,我們讓y i∈{0,…, C}其中y i = 0表示背景位置。注意,xi可以直接從feature map中提取,唯一的問題是為位置分配適當(dāng)?shù)臉?biāo)簽。標(biāo)記每個(gè)位置最直接的方法是使用ground truth邊界盒,即一個(gè)ground truth邊界盒內(nèi)的每個(gè)位置都可以用相應(yīng)的前景標(biāo)簽進(jìn)行標(biāo)記。但是,每個(gè)位置都可以與多個(gè)前景對(duì)象相關(guān)聯(lián)。用較小對(duì)象的標(biāo)簽標(biāo)記重疊位置的啟發(fā)式方法可能與使用錨的回歸任務(wù)不一致。因此,我們建議在半錨定檢測器中為每個(gè)錨定位置定義標(biāo)簽。

          對(duì)于每個(gè)位置,我們與基于錨的方法中一樣,將K個(gè)錨與不同的比例和縱橫比關(guān)聯(lián)起來。在傳統(tǒng)算法的基礎(chǔ)上,利用GT邊界盒計(jì)算loss,得到錨點(diǎn)的標(biāo)號(hào)。設(shè)one-hot向量y i,k∈{0,1}C+1表示第i個(gè)位置上第k個(gè)錨點(diǎn)的標(biāo)號(hào)。通過對(duì)一個(gè)位置錨的標(biāo)簽,我們可以得到該位置的置信分?jǐn)?shù)為:

          考慮到錨點(diǎn)中背景大量存在,我們將0≤γ≤1的分?jǐn)?shù)重新標(biāo)為背景(即c = 0,其中sci為si中第c個(gè)元素)

          這相當(dāng)于閾值移動(dòng)來解決類不平衡問題。給定置信分?jǐn)?shù),第i個(gè)位置的標(biāo)簽可以定義為:

          需要注意的是,錨只用于在分類任務(wù)中獲取位置標(biāo)簽。所提出的標(biāo)記策略如圖2所示??梢钥吹剑谡嬷颠吔绾兄?,許多非必要的位置被標(biāo)記為背景。為了進(jìn)一步演示我們的標(biāo)記策略,我們?cè)趫D3中展示了一些正位置的例子。


          有了標(biāo)記的位置,我們就可以像在其他工作中一樣,用常見的focal損失來訓(xùn)練分類器:


          3.2 Anchor Classification

          現(xiàn)在有了位置分類器和錨點(diǎn)回歸器,在推理過程中,位置分類器可以告訴我們對(duì)象c的第i個(gè)位置的概率Pr{yi = c|xi},回歸器提供錨點(diǎn){zi, K} K =1,…,K,其中zi,K表示第K個(gè)錨點(diǎn)在第i個(gè)位置的特征。這里是主要的gap,也就是K個(gè)錨中的哪個(gè)應(yīng)該是輸出。因此,我們的目標(biāo)是估計(jì)每個(gè)錨點(diǎn)的概率為Pr{yi,k = c|xi, zi,k},而只有對(duì)應(yīng)位置Pr{yi = c|x i}的概率。
          考慮到錨點(diǎn)的標(biāo)簽應(yīng)該與其位置一致,我們計(jì)算條件概率為:

          這個(gè)公式暗示了一個(gè)二元分類問題,識(shí)別錨與相同的標(biāo)簽作為位置。因此,我們可以將訓(xùn)練集收集為{zi,k, yi,k},其中:

          在傳統(tǒng)的錨基方法中,錨的標(biāo)簽{yi,k}是根據(jù)錨的先驗(yàn)形狀計(jì)算的。回歸后,細(xì)化后的形狀可能會(huì)與初始形狀不一樣,這實(shí)際上導(dǎo)致了很大的差異。我們的建議是通過計(jì)算回歸后改進(jìn)錨點(diǎn)的loss來消除這種差異。有了合適的標(biāo)簽,我們可以通過優(yōu)化focal損失來學(xué)習(xí)錨分類器。

          令μi,k表示錨點(diǎn)z i,k的IoU。首先,我們將每個(gè)位置的IoU分?jǐn)?shù)歸一化為:

          我們采用分?jǐn)?shù)作為軟標(biāo)簽,并引入平滑的focal損失:

          與標(biāo)準(zhǔn)focal損失相比,我們有μ?,k的平滑標(biāo)簽正錨,而不是1,可以捕獲不同的錨更好的分布和提高性能。在提出的平滑focal損失的情況下,錨分類器是通過最小化所有前景位置的損失來學(xué)習(xí)的:

          總之,半錨定探測器的目標(biāo)是最小化:


          4


          實(shí)驗(yàn)結(jié)果


          4.1 Ablation Study

          • Number of Anchors

          • Location Classification

          • Anchor Classification

          • Inference Strategy

          4.2 Comparison with State-of-the-Art


          下載1:OpenCV黑魔法


          AI算法與圖像處公眾號(hào)后臺(tái)回復(fù):OpenCV黑魔法,即可下載小編精心編寫整理的計(jì)算機(jī)視覺趣味實(shí)戰(zhàn)教程


          下載2 CVPR2020
          AI算法與圖像處公眾號(hào)后臺(tái)回復(fù):CVPR2020即可下載1467篇CVPR?2020論文
          個(gè)人微信(如果沒有備注不拉群!
          請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱

          瀏覽 66
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产钟合自拍 | 91九色视频网站 | 日本不卡一区 | 无码插入大大大大 | 天天撸天天干 |