【論文解讀】?YOLOX: Exceeding YOLO Series in 2021
導(dǎo)讀
曠視團(tuán)隊(duì)對(duì)YOLO系列的再一次超越。

論文鏈接:https://arxiv.org/abs/2107.08430
1.1 YOLOX-DarkNet53
YOLOv3 baseline ?以Darknet53作為Baseline,給大家介紹如何一步一步過渡到現(xiàn)在的YOLOX-DarkNet53。YOLOv3是以Darknet53為主干,后面再加上SPP。我們對(duì)訓(xùn)練策略進(jìn)行了一些修改,增加了EMA weights updating,余弦學(xué)習(xí)率,IoU損失,以及IoU-aware分支,在訓(xùn)練分類和objectness的分支中,我們使用了BCE loss。在數(shù)據(jù)增強(qiáng)方面,我們只使用了水平翻轉(zhuǎn),顏色抖動(dòng)和多尺度。
Decoupled head ?在目標(biāo)檢測中,分類和回歸的任務(wù)是有相互沖突的,這是個(gè)普遍認(rèn)可的問題。因此,一般會(huì)將分類和回歸分開2個(gè)分支,但是在YOLO系列中,仍然是沒有分開的。這里,我們將耦合的檢測頭分開,變?yōu)?個(gè)相互獨(dú)立的檢測分支。具體如下圖:

Strong data augmentation ?在數(shù)據(jù)增強(qiáng)中,我們使用了Mosaic和Mix up的增強(qiáng)策略,使用了這些增強(qiáng)策略之后,我發(fā)現(xiàn)預(yù)訓(xùn)練模型已經(jīng)沒有必要了,因此后面所有的訓(xùn)練都是從頭訓(xùn)練的。
Anchor-free ?將YOLO轉(zhuǎn)換為anchor free其實(shí)很簡單,我們將每個(gè)空間位置的輸出由3減少到1,直接輸出4個(gè)值,即左上角點(diǎn)的兩個(gè)偏差值,以及寬和高。對(duì)于每個(gè)目標(biāo),其中心點(diǎn)位置所在的區(qū)域即為正樣本,并預(yù)先定義一個(gè)尺度范圍,將每個(gè)目標(biāo)分配到不同的FPN層上。
Multi positives ?上面提到的anchor free的正樣本選擇策略,對(duì)于每個(gè)目標(biāo)只選擇了1個(gè)正樣本,這樣會(huì)忽略掉其他的高質(zhì)量的預(yù)測,使用這些高質(zhì)量的預(yù)測對(duì)于梯度是有好處的,而且樣本的不均衡性也會(huì)減少一些。這里,我們簡單的使用了中心點(diǎn)3x3的區(qū)域,都作為正樣本。
SimOTA 對(duì)于標(biāo)簽的分配,我們總結(jié)了4個(gè)關(guān)鍵點(diǎn):1)損失/質(zhì)量相關(guān)性 2)中心優(yōu)先 3)每個(gè)GT的正樣本anchor點(diǎn)的動(dòng)態(tài)數(shù)量 4)全局視角。我們使用OTA作為候選的標(biāo)簽匹配策略。然后對(duì)OTA進(jìn)行了修改,提出了SimOTA。首先,計(jì)算每個(gè)prediction-gt對(duì)的匹配度,用損失和質(zhì)量來表示,這里,在SimOTA中,使用損失來表示:

其中,λ是平衡系數(shù),然后,對(duì)于一個(gè)gt,用gi來表示,我們選擇在一個(gè)固定的中心區(qū)域內(nèi),topk個(gè)具有最小的cost的預(yù)測來作為正樣本,最后,這些正樣本所在的grid也被分配為正樣本,其他的grid是負(fù)樣本,注意,對(duì)于不同的gt,k是不一樣的。
End-to-end YOLO ?我們?cè)黾恿?個(gè)額外的卷積層,進(jìn)行一對(duì)一的標(biāo)簽分配,不需要梯度。這使得檢測器可以端到端的運(yùn)行,這個(gè)略微降低了性能和速度。所以作為可選項(xiàng)。
具體的各種修改的效果如下:

1.2 其他的backbone
我們還測試了其他的主干。
Modified CSPNet in YOLOv5

Tiny and Nano detectors

Model size and data augmentation


—END—論文鏈接:https://arxiv.org/abs/2107.08430
往期精彩回顧
- 適合初學(xué)者入門人工智能的路線及資料下載
- 機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印
- 機(jī)器學(xué)習(xí)在線手冊(cè)
- 深度學(xué)習(xí)筆記專輯
- 《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯
- AI基礎(chǔ)下載
- 機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專輯
- 溫州大學(xué)《機(jī)器學(xué)習(xí)課程》視頻
