詳解OpenVINO 模型庫(kù)中的人臉檢測(cè)模型

極市導(dǎo)讀
本文介紹了OpenVINO的三種人臉檢測(cè)模型:MobileNetv2、SqueezeNet和ResNet152。 >>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺(jué)的最前沿
OpenVINO的模型庫(kù)中有多個(gè)人臉檢測(cè)模型,這些模型分別支持不同場(chǎng)景與不同分辨率的人臉檢測(cè),同時(shí)檢測(cè)精度與速度也不同。下面以O(shè)penVINO2020 R04版本為例來(lái)逐一解釋模型庫(kù)中的人臉檢測(cè),列表如下:

從列表中可以看出骨干特征網(wǎng)絡(luò)主要是MobileNetv2與SqueezeNet兩種支持實(shí)時(shí)特征網(wǎng)絡(luò),ResNet152是高精度的特征網(wǎng)絡(luò),檢測(cè)頭分別支持SSD、FCOS、ATSS。
01 MobileNetv2版本的模型結(jié)構(gòu)



上面三張圖就是MobileNetv2的全部!看懂就好!
02 ResNet網(wǎng)絡(luò)
殘差網(wǎng)絡(luò)模型在2015年提出,OpenCV從3.3版本開(kāi)始支持,相關(guān)的論文如下:
https://arxiv.org/pdf/1512.03385.pdf
與VGG模型對(duì)比,模型結(jié)構(gòu):
03 SqueezeNet網(wǎng)絡(luò)
該模型與MobileNet網(wǎng)絡(luò)都是支持移動(dòng)端/端側(cè)可部署的模型,2016提出,相關(guān)論文如下:
https://arxiv.org/pdf/1602.07360.pdf
模型結(jié)構(gòu)
檢測(cè)模型
根據(jù)不同的檢測(cè)頭,組合生成不同的對(duì)象檢測(cè)模型,這里三種常見(jiàn)的檢測(cè)模型:
01 SSD檢測(cè)
SSD論文中給出的是基于VGG-16作為backbone網(wǎng)絡(luò)的,替換VGG為MobileNetV2,然后從第12個(gè)權(quán)重層開(kāi)始提取特征到第14或者15個(gè)權(quán)重層,針對(duì)anchor預(yù)測(cè)與類(lèi)別預(yù)測(cè)完成回歸與分類(lèi)損失計(jì)算,實(shí)現(xiàn)對(duì)象檢測(cè)模型訓(xùn)練。
02 FCOS檢測(cè)
跟YOLOv1相似是一個(gè)anchor-free的網(wǎng)絡(luò)模型,多了一個(gè)中心輸出來(lái)壓制低質(zhì)量的bounding box輸出。
03 ATSS
ATSS的全稱(chēng)是自適應(yīng)訓(xùn)練樣本選擇,

作者首先對(duì)比了RetinaNet與FCOS兩種對(duì)象檢測(cè)方法,發(fā)現(xiàn)對(duì)象檢測(cè)在回歸階段的本質(zhì)問(wèn)題是如何選擇正負(fù)樣本,解決樣本不平衡性問(wèn)題,從而提出了一種新的正負(fù)樣本選擇定義方法-自適應(yīng)訓(xùn)練樣本選擇(ATSS)。流程如下

該方法可以獲得更好的對(duì)象檢測(cè)精度與mAP,適用RetinaNet與FCOS等對(duì)象檢測(cè)網(wǎng)絡(luò)。實(shí)際實(shí)驗(yàn)數(shù)據(jù)對(duì)比:

代碼演示與對(duì)比
上面的OpenVINO的人臉檢測(cè)模型列表中,MobileNetv2 + SSD/FCOS適用于速度優(yōu)先,不同分辨率的場(chǎng)景,ResNet152 + ATSS是OpenVINO模型庫(kù)中的精度最高的人臉檢測(cè)預(yù)訓(xùn)練模型。下面我們就通過(guò)代碼分別測(cè)試FCOS與ATSS兩種檢測(cè)模型的檢測(cè)效果比較,針對(duì)同一張測(cè)試人臉圖像,圖示如下:(此張非原圖!原圖太大,無(wú)法上傳)

統(tǒng)一調(diào)整閾值為0.25,推理時(shí)間與檢測(cè)人臉總數(shù)的對(duì)比圖如下:
最終分別得到測(cè)試圖像如下:
FCOS:

ATSS:

推薦閱讀
2021-03-14
2021-01-19
2021-02-18

# CV技術(shù)社群邀請(qǐng)函 #
備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)
即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與 10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺(jué)開(kāi)發(fā)者互動(dòng)交流~

