基于 CNN 特征區(qū)域進行目標(biāo)檢測
點擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達
目標(biāo)檢測是目前計算機視覺領(lǐng)域最熱門的技術(shù)之一,該領(lǐng)域的研究一直在以非常快的速度進行。

一、R-CNN:
RCNN 基礎(chǔ)步驟:

缺點:
二、Fast R-CNN :
它包括以下步驟:

缺點:
盡管 Fast R-CNN 在速度和準(zhǔn)確性方面是對 R-CNN 的改進,但它仍然使用選擇性搜索區(qū)域提議,這實際上是一個耗時的過程。
三、Faster R-CNN :
以下是Faster R-CNN的步驟:
1. 整個圖像通過 CNN 向前傳遞以生成卷積特征圖(就像我們在 Fast R-CNN 的情況下所做的那樣)。
2. 通過在這些特征圖上應(yīng)用區(qū)域提議網(wǎng)絡(luò) (RPN) 來識別感興趣的區(qū)域,這些特征圖返回具有對象性分?jǐn)?shù)的對象提議。
3. 對它們應(yīng)用ROI池化層使它們具有相同的大小,然后將提案傳遞到全連接層。
4.在其頂部應(yīng)用Softmax層和線性回歸層對邊界框進行分類和輸出。

Faster R-CNN 是我們在本文中討論的對象檢測算法中最好的,對象檢測不僅限于基于區(qū)域的 CNN。
參考:
http://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf
https://arxiv.org/pdf/1311.2524.pdf
https://arxiv.org/pdf/1504.08083.pdf
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

