目標(biāo)檢測(cè) - 常見(jiàn)目標(biāo)檢測(cè)算法大匯總
點(diǎn)擊下方卡片,關(guān)注“新機(jī)器視覺(jué)”公眾號(hào)
重磅干貨,第一時(shí)間送達(dá)
第1章 目標(biāo)檢測(cè)概述
目標(biāo)檢測(cè)是對(duì)圖像分類(lèi)任務(wù)的進(jìn)一步加深,他不僅要識(shí)別出圖片中各種類(lèi)別的目標(biāo),還要把他們的位置找出來(lái)用矩形框框住。
在實(shí)際操作中,通常先找出目標(biāo)的位置(通過(guò)坐標(biāo)軸方框標(biāo)注出來(lái)),然后在對(duì)標(biāo)注的目標(biāo)進(jìn)行分類(lèi)。

目標(biāo)檢測(cè)是深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)非常重要的應(yīng)用,從本節(jié)開(kāi)始,我們將陸續(xù)開(kāi)始目標(biāo)檢測(cè)的學(xué)習(xí)。
根據(jù)算法的流程可以將目標(biāo)檢測(cè)算法分為兩種流派:
(1)以Faster R-CNN為代表的Two-Stage算法:
它檢測(cè)目標(biāo)主要分為兩個(gè)部分
通過(guò)專(zhuān)門(mén)模塊去生成候選框
尋找前景以及調(diào)整邊界框

(2)以SSD、YOLO為代表的One-Stage算法
它是直接基于anchor直接進(jìn)行分類(lèi)以及調(diào)整邊界框。
這兩種方式各有各的特別,Two-Stage很明顯檢測(cè)的精度要高一點(diǎn),但是檢測(cè)速度慢;

One-Stage放棄了高精度,但是換來(lái)了速度,速度比Two-Stage算法快很多。
接下來(lái)簡(jiǎn)單介紹幾種常用的目標(biāo)檢測(cè)算法
第2章 常見(jiàn)的Two-Stage算法
2.1 R-CNN
在過(guò)去的十多年時(shí)間里,傳統(tǒng)的機(jī)器視覺(jué)領(lǐng)域,通常采用特征描述子來(lái)應(yīng)對(duì)目標(biāo)識(shí)別任務(wù),這些特征描述子最常見(jiàn)的就是 SIFT 和 HOG.而 OpenCV 有現(xiàn)成的 API 可供大家實(shí)現(xiàn)相關(guān)的操作。
R-CNN(Region with CNN Feature)2014年提出,在此之前都是傳統(tǒng)的目標(biāo)檢測(cè)算法,人為定義特征進(jìn)行檢測(cè),進(jìn)入了瓶頸期,進(jìn)步緩慢,但是R-CNN出來(lái)之后將目標(biāo)檢測(cè)領(lǐng)域的準(zhǔn)確率至少提高了30%。

2012 年 Krizhevsky 等人在 ImageNet 舉辦的 ILSVRC 目標(biāo)識(shí)別挑戰(zhàn)大賽中一戰(zhàn)成名,豪奪當(dāng)年的第一名,Top5 錯(cuò)誤率 15%,而他們團(tuán)隊(duì)提出來(lái)的網(wǎng)絡(luò)結(jié)構(gòu)以第一作者 Alex Krizhevsky 名字命名,它就是 AlexNet

因?yàn)?AlexNet 的出現(xiàn),世人的目標(biāo)識(shí)別的目光重回神經(jīng)網(wǎng)絡(luò)領(lǐng)域,以此為契機(jī),不斷涌出各種各樣的網(wǎng)絡(luò)比如 VGG、GoogleNet、ResNet 等等。
受 AlexNet 啟發(fā),R-CNN論文作者嘗試將 AlexNet 在 ImageNet 目標(biāo)識(shí)別的能力泛化到 PASCAL VOC 目標(biāo)檢測(cè)上面來(lái)。
R-CNN 借鑒了滑動(dòng)窗口思想,采用對(duì)區(qū)域進(jìn)行識(shí)別的方案






第3章 常見(jiàn)的One-Stage算法
3.1 SSD

SSD是一種經(jīng)典的One-Stage算法,它解決當(dāng)時(shí)Faster R-CNN對(duì)小目標(biāo)檢測(cè)效果差和檢測(cè)速度慢的問(wèn)題。
SSD可以預(yù)測(cè)不用尺度的目標(biāo),它的網(wǎng)絡(luò)有6個(gè)輸出特征層。

使用Faster R-CNN在單GPU上大概每秒6、7張圖片;
而使用SSD算法,同樣在單GPU上它每秒能檢測(cè)50 、60 張圖片;
但相比之前使用了FPN的Faster R-CNN而言呢,SSD算法的檢測(cè)精度要差很多。
3.2 YOLO
YOLO系列算法是目前使用最多的目標(biāo)檢測(cè)算法,它最大的特點(diǎn)就是檢測(cè)速度快,而且現(xiàn)在檢測(cè)精度也就是mAP也變高了,所以稱(chēng)為時(shí)下最熱門(mén)的目標(biāo)檢測(cè)算法。
YOLO是在CVPR2016提出的一種目標(biāo)檢測(cè)算法,它一共有5個(gè)版本,YOLO v1到v3是同一個(gè)作者Joseph設(shè)計(jì)的,包括論文到算法結(jié)構(gòu),YOLO v4到v5是其他作者設(shè)計(jì)的,目前檢測(cè)效果最好和使用最多的就是YOLO v5。
其核心思想是將目標(biāo)檢測(cè)轉(zhuǎn)化為回歸問(wèn)題求解,并基于一個(gè)單獨(dú)的end-to-end網(wǎng)絡(luò):完成從原始圖像的輸入到物體位置和類(lèi)別的輸出。


YOLO在進(jìn)行預(yù)測(cè)時(shí),會(huì)對(duì)圖像進(jìn)行全面地推理。
它一種統(tǒng)一的目標(biāo)檢測(cè)模型。我們的模型構(gòu)建簡(jiǎn)單,可以直接在整張圖像上進(jìn)行訓(xùn)練。
第4章 匯總比較
4.1 匯總比較

版權(quán)聲明:本文為CSDN博主「文火冰糖的硅基工坊」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請(qǐng)附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/HiWangWenBing/article/details/122115271
本文僅做學(xué)術(shù)分享,如有侵權(quán),請(qǐng)聯(lián)系刪文。
