使用YOLOv8做目標(biāo)檢測、實例分割和圖像分類
點擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達(dá)
導(dǎo) 讀
本文主要介紹YOLOv8及使用它做目標(biāo)檢測、實例分割和圖像分類演示,僅供參考。
背景介紹
YOLOv8是來自Ultralytics的最新的基于YOLO的對象檢測模型系列,提供最先進(jìn)的性能。
利用以前的 YOLO 版本,YOLOv8模型更快、更準(zhǔn)確,同時為訓(xùn)練模型提供統(tǒng)一框架,以執(zhí)行:
物體檢測
實例分割
圖像分類
下面是使用YOLOv8做目標(biāo)檢測和實例分割的演示視頻:
YOLOv8的新特性與可用模型
以下是有關(guān)新版本的一些主要功能:
用戶友好的 API(命令行 + Python)。
更快更準(zhǔn)確。
支持:
物體檢測
實例分割
圖像分類
可擴(kuò)展到所有以前的版本。
新骨干網(wǎng)絡(luò)。
新的無錨頭。
新的損失函數(shù)。
YOLOv8 還高效靈活地支持多種導(dǎo)出格式,并且該模型可以在 CPU 和 GPU 上運行。
YOLOv8 模型的每個類別中有五個模型用于檢測、分割和分類。YOLOv8 Nano 是最快和最小的,而 YOLOv8 Extra Large (YOLOv8x) 是其中最準(zhǔn)確但最慢的。

YOLOv8 捆綁了以下預(yù)訓(xùn)練模型:
在圖像分辨率為 640 的 COCO 檢測數(shù)據(jù)集上訓(xùn)練的對象檢測檢查點。
在圖像分辨率為 640 的 COCO 分割數(shù)據(jù)集上訓(xùn)練的實例分割檢查點。
在圖像分辨率為 224 的 ImageNet 數(shù)據(jù)集上預(yù)訓(xùn)練的圖像分類模型。
如下是使用YOLOv8x做目標(biāo)檢測和實例分割模型的輸出:

如何使用YOLOv8
git clone https://github.com/ultralytics/ultralytics.git
pip install -r requirements.txt
在最新版本中,Ultralytics YOLOv8提供了完整的命令行界面 (CLI) API 和 Python SDK,用于執(zhí)行訓(xùn)練、驗證和推理。要使用yoloCLI,我們需要安裝ultralytics包。
pip install ultralytics
yolo task=detect \mode=predict \model=yolov8n.pt \source="image.jpg"
from ultralytics import YOLOmodel = YOLO("yolov8n.pt") # load a pretrained YOLOv8n modelmodel.train(data="coco128.yaml") # train the modelmodel.val() # evaluate model performance on the validation setmodel.predict(source="https://ultralytics.com/images/bus.jpg") # predict on an imagemodel.export(format="onnx") # export the model to ONNX format 例如,上述代碼首先會在COCO128數(shù)據(jù)集上訓(xùn)練YOLOv8 Nano模型,在驗證集上進(jìn)行評估,并對樣本圖像進(jìn)行預(yù)測。
讓我們使用yoloCLI 并使用對象檢測、實例分割和圖像分類模型進(jìn)行推理。
yolo task=detect mode=predict model=yolov8n.pt source='input/video_3.mp4' show=True 推理在筆記本電腦GTX1060 GPU上以接近105 FPS的速度運行。我們得到以下輸出:

yolo task=detect mode=predict model=yolov8x.pt source='input/video_3.mp4' show=True Extra Large模型在GTX1060 GPU上的平均運行速度為 17 FPS。

yolo task=segment mode=predict model=yolov8x-seg.pt source='input/video_3.mp4' show=True 因為實例分割與對象檢測相結(jié)合,所以這次的平均 FPS 約為 13。

yolo task=classify mode=predict model=yolov8x-cls.pt source='input/video_3.mp4' show=True
下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
在「小白學(xué)視覺」公眾號后臺回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。
下載2:Python視覺實戰(zhàn)項目52講
在「小白學(xué)視覺」公眾號后臺回復(fù):Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學(xué)校計算機(jī)視覺。
下載3:OpenCV實戰(zhàn)項目20講
在「小白學(xué)視覺」公眾號后臺回復(fù):OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。
交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

