<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          基于 CNN 特征區(qū)域進行目標(biāo)檢測

          共 2041字,需瀏覽 5分鐘

           ·

          2021-07-28 00:06

          點擊上方小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時間送達

          目標(biāo)檢測是目前計算機視覺領(lǐng)域最熱門的技術(shù)之一,該領(lǐng)域的研究一直在以非常快的速度進行。

          但究竟什么是物體檢測?對象檢測處理通過給定輸入(圖像或視頻)中的邊界識別和定位某些類的對象。


          截至目前,一些最成功的對象檢測算法如下:
          1. 基于區(qū)域的 CNN:RCNN、Fast RCNN、Faster RCNN
          2. YOLO
          3. SSD


          一、R-CNN:

          該算法在圖像中查找可能包含對象的特定區(qū)域(使用選擇性搜索)并通過 CNN 提取特征,提取的特征用于預(yù)測它們周圍的類和邊界框。


           RCNN 基礎(chǔ)步驟:

          1. 從輸入圖像中提取了大約 2000 個自下而上的區(qū)域。
          2. 無論候選區(qū)域的大小或縱橫比如何,我們都將圍繞邊界框中的所有像素扭曲到所需的大小。對于每個提議,它使用大型 CNN 計算特征。
          3. 它使用特定類的線性 SVM 對每個區(qū)域進行分類。
          4. 該算法還預(yù)測了四個偏移值,以提高邊界框的精度。



          缺點:

          1. 訓(xùn)練緩慢:每張圖像應(yīng)該分類大約 2000 個區(qū)域建議,這需要大量時間。
          2. 推理速度慢:使用 VGG16 大約需要 47 秒/每張圖像。


          二、Fast R-CNN :

          Fast R-CNN 是 R-CNN 算法的繼承者。與之前討論的 R-CNN 相比,F(xiàn)ast R-CNN 多項更改,使其更快、更準(zhǔn)確。R-CNN 的主要問題是它在不共享計算的情況下為每個區(qū)域提議執(zhí)行 CNN 傳遞。Fast R-CNN 通過通過 CNN 轉(zhuǎn)發(fā)整個圖像來改進 R-CNN。


          它包括以下步驟:

          1. 整個圖像通過CNN向前傳遞,生成卷積特征圖。
          2. 從卷積特征圖中識別感興趣的區(qū)域,并在其上應(yīng)用ROI 池化層以將它們?nèi)恐厮転橄嗤拇笮?。然后將每個建議傳遞給一個完全連接的層。
          3. 然后并行使用 Softmax 層和線性回歸層來輸出類和邊界框。



          缺點:

          盡管 Fast R-CNN 在速度和準(zhǔn)確性方面是對 R-CNN 的改進,但它仍然使用選擇性搜索區(qū)域提議,這實際上是一個耗時的過程。


          三、Faster R-CNN :

          Faster R-CNN 是對 Fast R-CNN 的進一步改進。Fast R-CNN 和 Faster R-CNN 之間的主要區(qū)別在于它使用區(qū)域提議網(wǎng)絡(luò) (RPN) 來生成感興趣的區(qū)域。

          以下是Faster R-CNN的步驟:

          1. 整個圖像通過 CNN 向前傳遞以生成卷積特征圖(就像我們在 Fast R-CNN 的情況下所做的那樣)。

          2. 通過在這些特征圖上應(yīng)用區(qū)域提議網(wǎng)絡(luò) (RPN) 來識別感興趣的區(qū)域,這些特征圖返回具有對象性分?jǐn)?shù)的對象提議。

          3. 對它們應(yīng)用ROI池化層使它們具有相同的大小,然后將提案傳遞到全連接層。

          4.在其頂部應(yīng)用Softmax層和線性回歸層對邊界框進行分類和輸出。

          Faster R-CNN 是我們在本文中討論的對象檢測算法中最好的,對象檢測不僅限于基于區(qū)域的 CNN。


          參考:

          1. http://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf

          2. https://arxiv.org/pdf/1311.2524.pdf

          3. https://arxiv.org/pdf/1504.08083.pdf



          下載1:OpenCV-Contrib擴展模塊中文版教程
          在「小白學(xué)視覺」公眾號后臺回復(fù):擴展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

          下載2:Python視覺實戰(zhàn)項目52講
          小白學(xué)視覺公眾號后臺回復(fù):Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學(xué)校計算機視覺。

          下載3:OpenCV實戰(zhàn)項目20講
          小白學(xué)視覺公眾號后臺回復(fù):OpenCV實戰(zhàn)項目20講即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學(xué)習(xí)進階。

          交流群


          歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~


          瀏覽 54
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  久久xxx | 天天爽夜夜爽夜夜爽精品 | 乐播一区二区三区 | 久久免费高清视频 | 少妇无码喷水久久 |