YOLOv6:又快又準(zhǔn)的目標(biāo)檢測框架開源啦

1. 概述
精度與速度遠(yuǎn)超 YOLOv5 和 YOLOX 的新框架
2. YOLOv6關(guān)鍵技術(shù)介紹
2.1 Hardware-friendly 的骨干網(wǎng)絡(luò)設(shè)計
2.2 更簡潔高效的 Decoupled Head
2.3 更有效的訓(xùn)練策略
3. 實驗結(jié)果
4. 總結(jié)與展望
1. 概述
精度與速度遠(yuǎn)超 YOLOv5 和 YOLOX 的新框架

圖1-1 YOLOv6 各尺寸模型與其他模型性能對比

2. YOLOv6關(guān)鍵技術(shù)介紹
我們統(tǒng)一設(shè)計了更高效的 Backbone 和 Neck :受到硬件感知神經(jīng)網(wǎng)絡(luò)設(shè)計思想的啟發(fā),基于 RepVGG style[4] 設(shè)計了可重參數(shù)化、更高效的骨干網(wǎng)絡(luò) EfficientRep Backbone 和 Rep-PAN Neck。 優(yōu)化設(shè)計了更簡潔有效的 Efficient Decoupled Head,在維持精度的同時,進(jìn)一步降低了一般解耦頭帶來的額外延時開銷。 在訓(xùn)練策略上,我們采用Anchor-free 無錨范式,同時輔以 SimOTA[2] 標(biāo)簽分配策略以及 SIoU[9] 邊界框回歸損失來進(jìn)一步提高檢測精度。
2.1 Hardware-friendly 的骨干網(wǎng)絡(luò)設(shè)計

引入了 RepVGG[4] style 結(jié)構(gòu)。 基于硬件感知思想重新設(shè)計了 Backbone 和 Neck。


2.2 更簡潔高效的 Decoupled Head
2.3 更有效的訓(xùn)練策略
3. 實驗結(jié)果


YOLOv6-nano 在 COCO val 上 取得了 35.0% AP 的精度,同時在 T4 上使用 TRT FP16 batchsize=32 進(jìn)行推理,可達(dá)到 1242FPS 的性能,相較于 YOLOv5-nano 精度提升 7% AP,速度提升 85%。 YOLOv6-tiny 在 COCO val 上 取得了 41.3% AP 的精度, 同時在 T4 上使用 TRT FP16 batchsize=32 進(jìn)行推理,可達(dá)到 602FPS 的性能,相較于 YOLOv5-s 精度提升 3.9% AP,速度提升 29.4%。 YOLOv6-s 在 COCO val 上 取得了 43.1% AP 的精度, 同時在 T4 上使用 TRT FP16 batchsize=32 進(jìn)行推理,可達(dá)到 520FPS 的性能,相較于 YOLOX-s 精度提升 2.6% AP,速度提升 38.6%;相較于 PP-YOLOE-s 精度提升 0.4% AP的條件下,在T4上使用 TRT FP16 進(jìn)行單 batch 推理,速度提升 71.3%。
4. 總結(jié)與展望
完善 YOLOv6 全系列模型,持續(xù)提升檢測性能。 在多種硬件平臺上,設(shè)計硬件友好的模型。 支持 ARM 平臺部署以及量化蒸餾等全鏈條適配。 橫向拓展和引入關(guān)聯(lián)技術(shù),如半監(jiān)督、自監(jiān)督學(xué)習(xí)等等。 探索 YOLOv6 在更多的未知業(yè)務(wù)場景上的泛化性能。
5. 參考文獻(xiàn)
6. 作者簡介
推薦閱讀
輔助模塊加速收斂,精度大幅提升!移動端實時的NanoDet-Plus來了!
機(jī)器學(xué)習(xí)算法工程師
一個用心的公眾號

評論
圖片
表情
