5個步驟實現(xiàn)目標檢測
點擊上方“小白學(xué)視覺”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
本文轉(zhuǎn)自:磐創(chuàng)AI
【導(dǎo)讀】目標檢測技術(shù)是當今計算機視覺領(lǐng)域的發(fā)展趨勢。在場景圖像和視頻中,有許多方法被用來檢測物體。在資源和執(zhí)行時間方面,每種技術(shù)都有自己的優(yōu)勢和局限性。檢測視頻中的物體也需要大量的技術(shù)知識和資源。

因此,人們一直在尋找一種簡單、快速的目標檢測方法。在本文中,我們將演示如何檢測視頻中看到的對象,只需5個步驟。
我們將在本任務(wù)中使用pixellib庫,該庫使用實例分割檢測對象。我們還將使用預(yù)訓(xùn)練Mask R-CNN模型來識別視頻中看到的物體。
在這個實現(xiàn)中,我們將檢測交通視頻中的車輛對象。
實例分割是計算機視覺中的一種技術(shù),它利用圖像分割的方法進行目標檢測。它在像素級識別圖像或視頻中存在的每個對象實例。
在圖像分割中,視覺輸入被分割成若干段,通過形成像素集合來表示對象或?qū)ο蟮囊徊糠帧嵗指钭R別圖像中每個對象的每個實例,而不是像語義分割那樣對每個像素進行分類。
Mask R-CNN是由Kaiming He等人在Facebook人工智能研究所提出的深層神經(jīng)網(wǎng)絡(luò)的變體。該模型用于解決計算機視覺中的對象實例分割問題。
它檢測圖像中的對象,同時為每個實例生成一個高質(zhì)量的分割掩碼。它是Faster R-CNN的一個擴展,它增加了一個預(yù)測目標掩碼的分支,與現(xiàn)有的邊界盒識別分支并行。
下面給出了用于實例分割的Mask R-CNN框架。

現(xiàn)在,我們將討論在視頻中檢測物體的步驟。
1.安裝庫和依賴項
在第一步中,我們需要安裝pixellib庫及其依賴項。
!pip install pixellib

2.加載預(yù)先訓(xùn)練的Mask RCNN權(quán)重
由于我們將使用Mask R-CNN模型來檢測目標,我們將下載其預(yù)訓(xùn)練的權(quán)重。
!wget --quiet https://github.com/matterport/Mask_RCNN/releases/download/v2.0/mask_rcnn_coco.h5
3.導(dǎo)入庫
現(xiàn)在,我們將導(dǎo)入已安裝的pixellib庫。我們還將導(dǎo)入instance_segmentation 類,因為我們將使用實例分割方法檢測對象。
import pixellib
from pixellib.instance import instance_segmentation
4.實例化實例分割模型并加載MASK R-CNN權(quán)重
在這一步中,我們將實例化pixellib提供的instance_segmentation類,并使用其預(yù)訓(xùn)練的權(quán)重加載Mask R-CNN模型。
segment_video = instance_segmentation()
segment_video.load_model("mask_rcnn_coco.h5")
5.檢測物體
在這一步中,我們將通過在視頻中MASK R-CNN來處理目標檢測任務(wù)。我們會用隨機使用一段交通視頻
視頻:https://analyticsindiamag.com/wp-content/uploads/2020/07/traffic_vid2.mp4?_=1
在這種方法中,我們設(shè)置每秒幀數(shù),即視頻輸出每秒的幀數(shù)。
segment_video.process_video("traffic_vid2.mp4", show_bboxes = True, frames_per_second= 15, output_video_name="object_detect.mp4")




最后,我們將在工作目錄中獲得輸出視頻。這個過程的時間取決于視頻的長度和大小。你應(yīng)該使用GPU來加快處理速度。對于上面的交通視頻,結(jié)果為
視頻:https://analyticsindiamag.com/wp-content/uploads/2020/07/Object_Detect.mp4?_=2
你可以定義一個函數(shù)來從YouTube獲取視頻并將其直接傳遞給上面的函數(shù)。
因此,利用以上步驟,我們可以討論一種非常簡單的方法來實現(xiàn)視頻中的目標檢測任務(wù)。剛?cè)腴T計算機視覺的可以用這種方法檢測物體。
原文鏈接:https://analyticsindiamag.com/hands-on-guide-to-detect-objects-in-video-in-5-steps/
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

