<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          BBAug數(shù)據(jù)增強(qiáng): 用于PyTorch檢測框

          共 3926字,需瀏覽 8分鐘

           ·

          2021-07-04 01:51

          點(diǎn)擊上方機(jī)器學(xué)習(xí)與生成對(duì)抗網(wǎng)絡(luò)”,關(guān)注星標(biāo)

          獲取有趣、好玩的前沿干貨!


          作者:Harpal Sahota 編譯:ronghuaiyang AI公園

          導(dǎo)讀

          實(shí)現(xiàn)了Google Research,Brain Team中的增強(qiáng)策略。


          像許多神經(jīng)網(wǎng)絡(luò)模型一樣,目標(biāo)檢測模型在訓(xùn)練大量數(shù)據(jù)時(shí)效果最好。通常情況下,可用的數(shù)據(jù)有限,世界各地的許多研究人員正在研究增強(qiáng)策略,以增加可用的數(shù)據(jù)量。谷歌的大腦團(tuán)隊(duì)進(jìn)行了一項(xiàng)這樣的研究,并發(fā)表在了一篇論文中,名為Learning Data Augmentation Strategies for Object Detection。在這篇論文中,作者確定了一組增強(qiáng)稱為策略,它對(duì)目標(biāo)檢測問題表現(xiàn)良好。該策略通過增強(qiáng)搜索獲得,提高了通用模型的性能。

          作者將增強(qiáng)策略定義為一組子策略。在模型進(jìn)行訓(xùn)練時(shí),隨機(jī)選擇其中一個(gè)子策略用于增強(qiáng)圖像。在每個(gè)子策略中都有要依次應(yīng)用于圖像的增強(qiáng)。每個(gè)轉(zhuǎn)換也有兩個(gè)超參數(shù):概率和幅度。概率表示該增強(qiáng)將被應(yīng)用的可能性,而幅度表示該增強(qiáng)的程度。下面的代碼顯示了本文中使用的策略:

          policy = [      
            [('TranslateX_BBox', 0.6, 4), ('Equalize', 0.8, 10)],        
            [('TranslateY_Only_BBoxes', 0.2, 2), ('Cutout', 0.8, 8)],     
            [('Sharpness', 0.0, 8), ('ShearX_BBox', 0.4, 0)],      
            [('ShearY_BBox', 1.0, 2), ('TranslateY_Only_BBoxes', 0.6, 6)], 
            [('Rotate_BBox', 0.6, 10), ('Color', 1.0, 6)],
          ]

          在這個(gè)策略中有5個(gè)子策略,如果我們?nèi)〉谝粋€(gè)子策略,它就包含了TranslateX_BBoxEqualize增強(qiáng)。TranslateX_BBox操作在x軸上轉(zhuǎn)換圖像的幅度為4。在本例中,大小并不直接轉(zhuǎn)換為像素,而是根據(jù)大小縮放為像素值。該增強(qiáng)的概率也為0.6,這意味著如果該增強(qiáng)被選中,則應(yīng)用該增強(qiáng)的概率為60%。隨著每個(gè)增強(qiáng)都有一個(gè)相關(guān)的概率,引入了一個(gè)隨機(jī)的概念,給訓(xùn)練增加了一定程度的隨機(jī)性??偟膩碚f,Brain Team已經(jīng)提出了4個(gè)策略: v0, v1, v2和v3。本文中顯示了v0策略,其他三個(gè)策略包含更多的子策略,這些子策略具有幾種不同的轉(zhuǎn)換??偟膩碚f,增加分為三類,作者定義為:

          顏色操作: 扭曲顏色通道,不影響邊界框的位置。

          幾何操作:幾何扭曲圖像,這相應(yīng)地改變了邊界框的位置和大小。

          包圍框操作:只會(huì)扭曲包圍框中包含的像素內(nèi)容。

          BBAug

          那么BBAug)在這方面有什么貢獻(xiàn)呢?BBAug是一個(gè)python包,它實(shí)現(xiàn)了谷歌Brain Team的所有策略。這個(gè)包是一個(gè)包裝器,可以更容易地使用這些策略。實(shí)際的擴(kuò)展是由優(yōu)秀的imgaug包完成的。

          上面顯示的策略應(yīng)用于一個(gè)示例圖像,如下所示。每一行是一個(gè)不同的子策略,每一列是該子策略的不同運(yùn)行。

          正如你所看到的,在子策略的運(yùn)行之間有一定程度的變化,因此給訓(xùn)練增加了一定程度的隨機(jī)性。這只是BBAug實(shí)施的4個(gè)策略之一。要查看所有4個(gè)策略的完整可視化,請查看包的GitHub頁面:https://github.com/harpalsahota/bbaug。該包還提供了一些有用的功能,比如定制策略的可能性,以及位于圖像外部的邊界框,如果它們部分位于圖像外部,則會(huì)被自動(dòng)刪除或剪切。例如,在下面的圖像中,應(yīng)用了平移增強(qiáng),將邊界框部分推到圖像外部。你可以看到新的邊界框已經(jīng)縮小以適應(yīng)這一點(diǎn)。

          也可以創(chuàng)建只影響邊界框區(qū)域的增強(qiáng)。在下圖中,solarisaugmentation只應(yīng)用于邊界框區(qū)域:

          用隨機(jī)策略增加單個(gè)圖像有多容易?就像這樣簡單:

          from bbaug import policies

          # select policy v0 set
          aug_policy = policies.policies_v0()
           
          # instantiate the policy container with the selected policy set
          policy_container = policies.PolicyContainer(aug_policy)

          # select a random policy from the policy set
          random_policy = policy_container.select_random_policy() 

          # Apply the augmentation. Returns the augmented image and bounding boxes.
          # Image is a numpy array of the image
          # Bounding boxes is a list of list of bounding boxes in pixels (int).
          # e.g. [[x_min, y_min, x_man, y_max], [x_min, y_min, x_man, y_max]]
          # Labels are the class labels for the bounding boxes as an iterable of ints e.g. [1,0]
          img_aug, bbs_aug = policy_container.apply_augmentation(random_policy, image, bounding_boxes, labels)
          # image_aug: numpy array of the augmented image
          # bbs_aug: numpy array of augmneted bounding boxes in format: [[label, x_min, y_min, x_man, y_max],...]

          總結(jié)

          該包實(shí)現(xiàn)了谷歌Brain Team推導(dǎo)出的增強(qiáng)策略。目前,已經(jīng)實(shí)現(xiàn)了所有4個(gè)策略,該包還附帶了notebooks,以幫助用戶將這些策略集成到他們的PyTorch訓(xùn)練pipeline中。


          END

          英文原文:https://towardsdatascience.com/bbaug-a-package-for-bounding-box-augmentation-in-pytorch-e9b9fbf1504b



          猜您喜歡:


          超100篇!CVPR 2020最全GAN論文梳理匯總!

          拆解組新的GAN:解耦表征MixNMatch

          StarGAN第2版:多域多樣性圖像生成


          附下載 | 《可解釋的機(jī)器學(xué)習(xí)》中文版

          附下載 |《TensorFlow 2.0 深度學(xué)習(xí)算法實(shí)戰(zhàn)》

          附下載 |《計(jì)算機(jī)視覺中的數(shù)學(xué)方法》分享


          《基于深度學(xué)習(xí)的表面缺陷檢測方法綜述》

          《零樣本圖像分類綜述: 十年進(jìn)展》

          《基于深度神經(jīng)網(wǎng)絡(luò)的少樣本學(xué)習(xí)綜述》


          瀏覽 47
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美内射视频网站 | 成人午夜无码 | 国产内射久久 | 欧美日韩国产中文精品字幕自在 | 亚洲成人AV在线 |