<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          干貨|在目標(biāo)檢測(cè)中如何解決小目標(biāo)的問(wèn)題?

          共 3056字,需瀏覽 7分鐘

           ·

          2021-05-11 02:43

          ↑ 點(diǎn)擊藍(lán)字 關(guān)注極市平臺(tái)

          作者丨Nabil MADALI
          來(lái)源丨AI公園
          編輯丨極市平臺(tái)

          極市導(dǎo)讀

           

          本文介紹了一些小目標(biāo)物體檢測(cè)的方法和思路。 >>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺(jué)的最前沿

          在深度學(xué)習(xí)目標(biāo)檢測(cè)中,特別是人臉檢測(cè)中,由于分辨率低、圖像模糊、信息少、噪聲多,小目標(biāo)和小人臉的檢測(cè)一直是一個(gè)實(shí)用和常見(jiàn)的難點(diǎn)問(wèn)題。然而,在過(guò)去幾年的發(fā)展中,也出現(xiàn)了一些提高小目標(biāo)檢測(cè)性能的解決方案。本文將對(duì)這些方法進(jìn)行分析、整理和總結(jié)。

          圖像金字塔和多尺度滑動(dòng)窗口檢測(cè)

          一開(kāi)始,在深學(xué)習(xí)方法成為流行之前,對(duì)于不同尺度的目標(biāo),通常是從原始圖像開(kāi)始,使用不同的分辨率構(gòu)建圖像金字塔,然后使用分類(lèi)器對(duì)金字塔的每一層進(jìn)行滑動(dòng)窗口的目標(biāo)檢測(cè)。

          在著名的人臉檢測(cè)器MTCNN中,使用圖像金字塔法檢測(cè)不同分辨率的人臉目標(biāo)。然而,這種方法通常是緩慢的,雖然構(gòu)建圖像金字塔可以使用卷積核分離加速或簡(jiǎn)單粗暴地縮放,但仍需要做多個(gè)特征提取,后來(lái)有人借其想法想出一個(gè)特征金字塔網(wǎng)絡(luò)FPN,在不同層融合特征,只需要一次正向計(jì)算,不需要縮放圖片。它也被應(yīng)用于小目標(biāo)檢測(cè),這將在后面的文章中討論。

          簡(jiǎn)單,粗暴和可靠的數(shù)據(jù)增強(qiáng)

          通過(guò)增加訓(xùn)練集中小目標(biāo)樣本的種類(lèi)和數(shù)量,也可以提高小目標(biāo)檢測(cè)的性能。有兩種簡(jiǎn)單而粗糙的方法:

          • 針對(duì)COCO數(shù)據(jù)集中含有小目標(biāo)的圖片數(shù)量較少的問(wèn)題,使用過(guò)采樣策略:

          不同采樣比的實(shí)驗(yàn)。我們觀察到,不管檢測(cè)小目標(biāo)的比率是多少,過(guò)采樣都有幫助。這個(gè)比例使我們能夠在大小物體之間做出權(quán)衡。

          • 針對(duì)同一張圖片中小目標(biāo)數(shù)量少的問(wèn)題,使用分割mask切出小目標(biāo)圖像,然后使用復(fù)制和粘貼方法(當(dāng)然,再加一些旋轉(zhuǎn)和縮放)。

          通過(guò)復(fù)制粘貼小目標(biāo)來(lái)實(shí)現(xiàn)人工增強(qiáng)的例子。正如我們?cè)谶@些例子中所觀察到的,粘貼在同一幅圖像上可以獲得正確的小目標(biāo)的周?chē)h(huán)境。

          在Anchor策略方法中,如果同一幅圖中有更多的小目標(biāo),則會(huì)匹配更多的正樣本。

          與ground truth物體相匹配的不同尺度anchor示意圖,小的目標(biāo)匹配到更少的anchor。

          為了克服這一問(wèn)題,我們提出通過(guò)復(fù)制粘貼小目標(biāo)來(lái)人工增強(qiáng)圖像,使訓(xùn)練過(guò)程中有更多的anchor與小目標(biāo)匹配。

          特征融合FPN

          不同階段的特征圖對(duì)應(yīng)不同的感受野,其所表達(dá)的信息抽象程度也不同。

          淺層特征圖感受野小,更適合檢測(cè)小目標(biāo),深層特征圖較大,更適合檢測(cè)大目標(biāo)。因此,有人提出將不同階段的特征映射整合在一起來(lái)提高目標(biāo)檢測(cè)性能,稱(chēng)之為特征金字塔網(wǎng)絡(luò)FPN。

          (a)利用圖像金字塔建立特征金字塔。特征的計(jì)算是在每個(gè)圖像的尺度上獨(dú)立進(jìn)行的,這是很緩慢的。(b)最近的檢測(cè)系統(tǒng)選擇只使用單一尺度的特征以更快地檢測(cè)。另一種選擇是重用由ConvNet計(jì)算出的金字塔特征層次結(jié)構(gòu),就好像它是一個(gè)特征圖金字塔。(d)我們提出的特征金字塔網(wǎng)絡(luò)(FPN)與(b)和?一樣快,但更準(zhǔn)確。在這個(gè)圖中,特征圖用藍(lán)色輪廓線表示,較粗的輪廓線表示語(yǔ)義上較強(qiáng)的特征。

          由于可以通過(guò)融合不同分辨率的特征圖來(lái)提高特征的豐富度和信息含量來(lái)檢測(cè)不同大小的目標(biāo),自然會(huì)有人進(jìn)一步猜測(cè),如果只檢測(cè)高分辨率的特征圖(淺層特征)來(lái)檢測(cè)小人臉,使用中分辨率特征圖(中間特征)來(lái)檢測(cè)大的臉。

          SSH的網(wǎng)絡(luò)結(jié)構(gòu)

          合適的訓(xùn)練方法SNIP, SNIPER, SAN

          在機(jī)器學(xué)習(xí)中有一點(diǎn)很重要,模型預(yù)訓(xùn)練的分布應(yīng)該盡可能接近測(cè)試輸入的分布。因此,在大分辨率(如常見(jiàn)的224 x 224)下訓(xùn)練的模型不適合檢測(cè)小分辨率的圖像,然后放大并輸入到模型中。

          如果輸入的是小分辨率的圖像,則在小分辨率的圖像上訓(xùn)練模型,如果沒(méi)有,則應(yīng)該先用大分辨率的圖片訓(xùn)練模型,然后再用小分辨率的圖片進(jìn)行微調(diào),最壞的情況是直接使用大分辨率的圖像來(lái)預(yù)測(cè)小分辨率的圖像(通過(guò)上采樣放大)。

          因此,在實(shí)際應(yīng)用中,對(duì)輸入圖像進(jìn)行放大并進(jìn)行高速率的圖像預(yù)訓(xùn)練,然后對(duì)小圖像進(jìn)行微調(diào)比針對(duì)小目標(biāo)訓(xùn)練分類(lèi)器效果更好。

          所有的圖都報(bào)告了ImageNet分類(lèi)數(shù)據(jù)集驗(yàn)證集的準(zhǔn)確性。我們對(duì)48、64、80等分辨率的圖像進(jìn)行上采樣,在圖(a)中繪制出預(yù)訓(xùn)練的ResNet-101分類(lèi)器的Top-1精度。圖(b、c)分別為原始圖像分辨率為48,96像素時(shí)不同cnn的結(jié)果。

          更密集的Anchor采樣和匹配策略S3FD, FaceBoxes

          如前面的數(shù)據(jù)增強(qiáng)部分所述,將一個(gè)小目標(biāo)復(fù)制到圖片中的多個(gè)位置,可以增加小目標(biāo)匹配的anchor數(shù)量,增加小目標(biāo)的訓(xùn)練權(quán)重,減少網(wǎng)絡(luò)對(duì)大目標(biāo)的偏置。同樣,在逆向思維中,如果數(shù)據(jù)集已經(jīng)確定,我們也可以增加負(fù)責(zé)小目標(biāo)的anchor的設(shè)置策略,使訓(xùn)練過(guò)程中對(duì)小目標(biāo)的學(xué)習(xí)更加充分。

          例如,在FaceBoxes中,其中一個(gè)貢獻(xiàn)是anchor策略。

          Anchor變的密集例子。為了清晰起見(jiàn),我們只對(duì)一個(gè)感受野中心(即中央黑色網(wǎng)格)密集化錨點(diǎn),并只給對(duì)角錨點(diǎn)上色。

          Anchor密集化策略,使不同類(lèi)型的anchor在圖像上具有相同的密度,顯著提高小人臉的召回率。

          總結(jié)

          本文較詳細(xì)地總結(jié)了一般目標(biāo)檢測(cè)和特殊人臉檢測(cè)中常見(jiàn)的小目標(biāo)檢測(cè)解決方案。

          英文原文:https://medium.datadriveninvestor.com/how-to-deal-with-small-objects-in-object-detection-44d28d136cbc

          本文亮點(diǎn)總結(jié)


          1.提高小目標(biāo)檢測(cè)的兩個(gè)簡(jiǎn)單方法:1.針對(duì)COCO數(shù)據(jù)集中含有小目標(biāo)的圖片數(shù)量較少的問(wèn)題,使用過(guò)采樣策略;2.針對(duì)同一張圖片中小目標(biāo)數(shù)量少的問(wèn)題,使用分割mask切出小目標(biāo)圖像,然后使用復(fù)制和粘貼方法(當(dāng)然,再加一些旋轉(zhuǎn)和縮放)。

          2.若數(shù)據(jù)集已經(jīng)確定,可以增加負(fù)責(zé)小目標(biāo)的anchor的設(shè)置策略,使訓(xùn)練過(guò)程中對(duì)小目標(biāo)的學(xué)習(xí)更加充分。

          如果覺(jué)得有用,就請(qǐng)分享到朋友圈吧!

          △點(diǎn)擊卡片關(guān)注極市平臺(tái),獲取最新CV干貨

          公眾號(hào)后臺(tái)回復(fù)“醫(yī)學(xué)影像”獲取醫(yī)學(xué)影像綜述~


          極市干貨

          頂會(huì)干貨CVPR 二十年,影響力最大的 10 篇論文! CVPR2021 最新18篇 Oral 論文學(xué)術(shù)論文投稿與Rebuttal經(jīng)驗(yàn)分享

          實(shí)操教程PyTorch自定義CUDA算子教程與運(yùn)行時(shí)間分析pytorch中使用detach并不能阻止參數(shù)更新

          招聘面經(jīng)秋招計(jì)算機(jī)視覺(jué)匯總面經(jīng)分享算法工程師面試題匯總

          最新CV競(jìng)賽:2021 高通人工智能應(yīng)用創(chuàng)新大賽CVPR 2021 | Short-video Face Parsing Challenge


          CV技術(shù)社群邀請(qǐng)函 #

          △長(zhǎng)按添加極市小助手
          添加極市小助手微信(ID : cvmart2)

          備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)


          即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群


          每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與 10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺(jué)開(kāi)發(fā)者互動(dòng)交流~



          覺(jué)得有用麻煩給個(gè)在看啦~  
          瀏覽 54
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  大香蕉伊人黄色 | 色婷婷五月天影院 | 色婷婷视频观看 | 操BAV视频 | 国产午夜精品久久 |