<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          即插即用 | SIoU 實現(xiàn)50.3 AP+7.6ms檢測速度精度、速度完美超越Y(jié)oloV5、YoloX

          共 2280字,需瀏覽 5分鐘

           ·

          2022-05-28 01:44



          目標檢測是計算機視覺任務(wù)的核心問題之一,其有效性在很大程度上取決于損失函數(shù)的定義。傳統(tǒng)的目標檢測損失函數(shù)依賴于邊界框回歸指標的聚合,例如預(yù)測框和真實框(即 GIoU、CIoU、ICIoU 等)的距離、重疊區(qū)域和縱橫比。

          然而,迄今為止提出和使用的方法都沒有考慮到所需真實框與預(yù)測框之間不匹配的方向。這種不足導(dǎo)致收斂速度較慢且效率較低,因為預(yù)測框可能在訓(xùn)練過程中“四處游蕩”并最終產(chǎn)生更差的模型。

          在本文中,提出了一種新的損失函數(shù) SIoU,其中考慮到所需回歸之間的向量角度,重新定義了懲罰指標。應(yīng)用于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)集,表明 SIoU 提高了訓(xùn)練的速度和推理的準確性。

          在許多模擬和測試中揭示了所提出的損失函數(shù)的有效性。特別是,將 SIoU 應(yīng)用于 COCO-train/COCO-val 與其他損失函數(shù)相比,提高了 +2.4% ([email protected]:0.95) 和 +3.6%([email protected])。

          1簡介

          我們都知道目標檢測中損失函數(shù)(LF)的定義起著重要作用。后者作為一種懲罰措施,需要在訓(xùn)練期間最小化,并且理想情況下可以將勾勒出目標的預(yù)測框與相應(yīng)的真實框匹配。為目標檢測問題定義 LF 有不同的方法,這些方法考慮到框的以下“不匹配”指標的某種組合:框中心之間的距離、重疊區(qū)域和縱橫比。

          最近 Rezatofighi 等人聲稱Generalized IoU (GIoU) LF優(yōu)于其他標準 LF 的最先進的目標檢測方法。雖然這些方法對訓(xùn)練過程和最終結(jié)果都產(chǎn)生了積極影響,但作者認為仍有很大改進的空間。因此,與用于計算圖像中真實框和模型預(yù)測框不匹配的懲罰的傳統(tǒng)指標并行——即距離、形狀和 IoU,本文作者建議還要考慮匹配的方向。這種添加極大地幫助了訓(xùn)練收斂過程和效果,因為它可以讓預(yù)測框很快地移動到最近的軸,并且隨后的方法只需要一個坐標 X 或 Y 的回歸。簡而言之,添加Angle懲罰成本有效地減少了損失的總自由度。

          2SIoU Loss

          SIoU損失函數(shù)由4個Cost函數(shù)組成:

          • Angle cost
          • Distance cost
          • Shape cost
          • IoU cost

          2.1 Angle cost

          添加這種角度感知 LF 組件背后的想法是最大限度地減少與距離相關(guān)的“奇妙”中的變量數(shù)量。基本上,模型將嘗試首先將預(yù)測帶到 X 或 Y 軸(以最接近者為準),然后沿著相關(guān)軸繼續(xù)接近。

          如果 ?? ≤Π/4,收斂過程將首先最小化?? , 否則最小化β:

          為了首先實現(xiàn)這一點,以以下方式引入和定義了LF組件:

          其中,

          Angle cost的曲線如圖2所示。

          圖2

          2.2 Distance cost

          考慮到上面定義的Angle cost,重新定義了Distance cost

          其中,

          可以看出,當(dāng)??→0時,Distance cost的貢獻大大降低。相反,??越接近Π/4,Distance cost貢獻越大。隨著角度的增大,問題變得越來越難。因此,γ被賦予時間優(yōu)先的距離值,隨著角度的增加。

          2.3 Shape cost

          Shape cost的定義為:

          其中,

          ?? 的值定義了每個數(shù)據(jù)集的Shape cost及其值是唯一的。?? 的值是這個等式中非常重要的一項,它控制著對Shape cost的關(guān)注程度。如果 ?? 的值設(shè)置為 1,它將立即優(yōu)化一個Shape,從而損害Shape的自由移動。為了計算 ?? 的值,作者將遺傳算法用于每個數(shù)據(jù)集,實驗上 ?? 的值接近 4,文中作者為此參數(shù)定義的范圍是 2 到 6。

          2.4 IoU Cost

          IoU cost的定義為:

          其中,

          2.5 SIoU Loss

          最后,回歸損失函數(shù)為:

          總損失函數(shù)為:

          其中 是Focal Loss,、分別是框和分類損失權(quán)重。為了計算、??,使用了遺傳算法。

          3實驗結(jié)果

          圖 10 總結(jié)了不同模型與 [email protected]:0.95 的推理時間。顯然,Scylla-Net 的 mAP 值較高,而模型推理時間遠低于比較模型的推理時間。

          圖 10

          COCO-val 上 SIoU 的 mAP 為 52.7% [email protected]:0.95(包括預(yù)處理、推理和后處理為 7.6ms)和 70% [email protected],同時 CIoU 為分別只有 50.3% 和 66.4%。

          更大的模型可以達到 57.1% [email protected]:0.95(12ms 包括預(yù)處理、推理和后處理)和 74.3% [email protected],而其他架構(gòu)如 Efficient-Det-d7x、YOLO-V4YOLO-V5 可以達到[email protected]:0.95分別為 54.4% (153ms)、47.1% (26.3ms) 和 50.4%(使用 fp16 進行 6.1ms)。

          請注意,YOLO-V5x6-TTA 在 COCO-val 上可以達到約 55%,但推理時間非常慢(FP16 時約為 72ms)。

          4參考

          [1].SIoU Loss: More Powerful Learning for Bounding Box Regression




          推薦閱讀

          深入理解生成模型VAE

          DropBlock的原理和實現(xiàn)

          SOTA模型Swin Transformer是如何煉成的!

          有碼有顏!你要的生成模型VQ-VAE來了!

          集成YYDS!讓你的模型更快更準!

          輔助模塊加速收斂,精度大幅提升!移動端實時的NanoDet-Plus來了!

          SimMIM:一種更簡單的MIM方法

          SSD的torchvision版本實現(xiàn)詳解


          機器學(xué)習(xí)算法工程師


          ? ??? ? ? ? ? ? ? ? ? ? ????????? ??一個用心的公眾號

          瀏覽 44
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  在线无码免费视频 | 操操视频网站 | 狠狠撸奇米影视 | 国产女人AV第一 | 在线播放亚洲无码 |