<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【論文解讀】?YOLOX: Exceeding YOLO Series in 2021

          共 1531字,需瀏覽 4分鐘

           ·

          2021-07-31 02:15

          導(dǎo)讀

          曠視團(tuán)隊(duì)對(duì)YOLO系列的再一次超越。


          3955f9a63132ddeb823b39eb856d7f59.webp


          文鏈接:https://arxiv.org/abs/2107.08430

          1. YOLOX

          1.1 YOLOX-DarkNet53

          YOLOv3 baseline ?以Darknet53作為Baseline,給大家介紹如何一步一步過渡到現(xiàn)在的YOLOX-DarkNet53。YOLOv3是以Darknet53為主干,后面再加上SPP。我們對(duì)訓(xùn)練策略進(jìn)行了一些修改,增加了EMA weights updating,余弦學(xué)習(xí)率,IoU損失,以及IoU-aware分支,在訓(xùn)練分類和objectness的分支中,我們使用了BCE loss。在數(shù)據(jù)增強(qiáng)方面,我們只使用了水平翻轉(zhuǎn),顏色抖動(dòng)和多尺度。

          Decoupled head ?在目標(biāo)檢測中,分類和回歸的任務(wù)是有相互沖突的,這是個(gè)普遍認(rèn)可的問題。因此,一般會(huì)將分類和回歸分開2個(gè)分支,但是在YOLO系列中,仍然是沒有分開的。這里,我們將耦合的檢測頭分開,變?yōu)?個(gè)相互獨(dú)立的檢測分支。具體如下圖:

          893f14c836a1ea185334e5aade0b83d8.webp

          Strong data augmentation ?在數(shù)據(jù)增強(qiáng)中,我們使用了Mosaic和Mix up的增強(qiáng)策略,使用了這些增強(qiáng)策略之后,我發(fā)現(xiàn)預(yù)訓(xùn)練模型已經(jīng)沒有必要了,因此后面所有的訓(xùn)練都是從頭訓(xùn)練的。

          Anchor-free ?將YOLO轉(zhuǎn)換為anchor free其實(shí)很簡單,我們將每個(gè)空間位置的輸出由3減少到1,直接輸出4個(gè)值,即左上角點(diǎn)的兩個(gè)偏差值,以及寬和高。對(duì)于每個(gè)目標(biāo),其中心點(diǎn)位置所在的區(qū)域即為正樣本,并預(yù)先定義一個(gè)尺度范圍,將每個(gè)目標(biāo)分配到不同的FPN層上。

          Multi positives ?上面提到的anchor free的正樣本選擇策略,對(duì)于每個(gè)目標(biāo)只選擇了1個(gè)正樣本,這樣會(huì)忽略掉其他的高質(zhì)量的預(yù)測,使用這些高質(zhì)量的預(yù)測對(duì)于梯度是有好處的,而且樣本的不均衡性也會(huì)減少一些。這里,我們簡單的使用了中心點(diǎn)3x3的區(qū)域,都作為正樣本。

          SimOTA 對(duì)于標(biāo)簽的分配,我們總結(jié)了4個(gè)關(guān)鍵點(diǎn):1)損失/質(zhì)量相關(guān)性 2)中心優(yōu)先 3)每個(gè)GT的正樣本anchor點(diǎn)的動(dòng)態(tài)數(shù)量 4)全局視角。我們使用OTA作為候選的標(biāo)簽匹配策略。然后對(duì)OTA進(jìn)行了修改,提出了SimOTA。首先,計(jì)算每個(gè)prediction-gt對(duì)的匹配度,用損失和質(zhì)量來表示,這里,在SimOTA中,使用損失來表示:

          5865edcbf2a0ecaab6aa1fc4cc4425a1.webp

          其中,λ是平衡系數(shù),然后,對(duì)于一個(gè)gt,用gi來表示,我們選擇在一個(gè)固定的中心區(qū)域內(nèi),topk個(gè)具有最小的cost的預(yù)測來作為正樣本,最后,這些正樣本所在的grid也被分配為正樣本,其他的grid是負(fù)樣本,注意,對(duì)于不同的gt,k是不一樣的。

          End-to-end YOLO ?我們?cè)黾恿?個(gè)額外的卷積層,進(jìn)行一對(duì)一的標(biāo)簽分配,不需要梯度。這使得檢測器可以端到端的運(yùn)行,這個(gè)略微降低了性能和速度。所以作為可選項(xiàng)。

          具體的各種修改的效果如下:

          30143d10b4d6c84a411a9c4ba00c469a.webp

          1.2 其他的backbone

          我們還測試了其他的主干。

          Modified CSPNet in YOLOv5

          b32141b25ed3e8918e4e51ba24afd3e7.webp

          Tiny and Nano detectors

          6a2f4c36420cc60dc255c91b819cbfd9.webp

          Model size and data augmentation

          8ba84091d78e4fdf1dc4770b6958e38a.webp

          2. 和其他的SOTA的對(duì)比

          27ce944b52822d9ba64d25e943b4e571.webp


          7a03cdb8a60072496b7a8d9023c5e601.webpEND

          論文鏈接:https://arxiv.org/abs/2107.08430

          往期精彩回顧



          本站qq群851320808,加入微信群請(qǐng)掃碼:
          瀏覽 41
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文字幕在线中文 | 国产灬性灬淫…乱…视频… | 日韩一区二区三区无码影院 | 国产亚洲黄色片 | 国产精品又黄又爽又色无遮挡 |