MindFace人臉識(shí)別和檢測(cè)模型工具包
MindFace是一款基于 MindSpore 的開(kāi)源工具包,包含最先進(jìn)的人臉識(shí)別和檢測(cè)模型,如ArcFace、RetinaFace和其他模型,主要用于面部識(shí)別和檢測(cè)等常見(jiàn)應(yīng)用場(chǎng)景。
MindFace主要具有以下優(yōu)點(diǎn):
-
統(tǒng)一應(yīng)用程序編程接口
MindFace通過(guò)解耦模型為人臉識(shí)別和檢測(cè)提供了統(tǒng)一的應(yīng)用程序編程接口,從而可以使用MindFace API直接調(diào)用模型,這大大降低了用戶構(gòu)建算法的難度。
-
強(qiáng)大的可擴(kuò)展性
MindFace目前支持基于統(tǒng)一API的人臉識(shí)別和檢測(cè),具有強(qiáng)大可擴(kuò)展性,它可以支持許多主干網(wǎng)絡(luò)、數(shù)據(jù)集和損失函數(shù)。此外,MindFace還支持多平臺(tái)調(diào)試,包括CPU、GPU和Ascend平臺(tái)。
基準(zhǔn)結(jié)果
識(shí)別任務(wù)
基于MindSpore實(shí)現(xiàn)的ArcFace系列模型取得了良好性能。我們基于ResNet、MobileNet和vit實(shí)現(xiàn)了三個(gè)版本,以滿足不同的需求。詳細(xì)結(jié)果如下表所示。
| 數(shù)據(jù)集 | 主干網(wǎng)絡(luò) | lfw | cfp_fp | agedb_30 | calfw | cplfw |
|---|---|---|---|---|---|---|
| CASIA | mobilefacenet-0.45g | 0.98483+-0.00425 | 0.86843+-0.01838 | 0.90133+-0.02118 | 0.90917+-0.01294 | 0.81217+-0.02232 |
| CASIA | r50 | 0.98667+-0.00435 | 0.90357+-0.01300 | 0.91750+-0.02277 | 0.92033+-0.01122 | 0.83667+-0.01719 |
| CASIA | r100 | 0.98950+-0.00366 | 0.90943+-0.01300 | 0.91833+-0.01655 | 0.92433+-0.01017 | 0.84967+-0.01904 |
| CASIA | vit-t | 0.98400+-0.00704 | 0.83229+-0.01877 | 0.87283+-0.02468 | 0.90667+-0.00934 | 0.80700+-0.01767 |
| CASIA | vit-s | 0.98550+-0.00806 | 0.85557+-0.01617 | 0.87850+-0.02194 | 0.91083+-0.00876 | 0.82500+-0.01685 |
| CASIA | vit-b | 0.98333+-0.00553 | 0.85829+-0.01836 | 0.87417+-0.01838 | 0.90800+-0.00968 | 0.81400+-0.02236 |
| CASIA | vit-l | 0.97600+-0.00898 | 0.84543+-0.01718 | 0.85317+-0.01411 | 0.89733+-0.00910 | 0.79550+-0.01648 |
| MS1MV2 | mobilefacenet-0.45g | 0.98700+-0.00364 | 0.88214+-0.01493 | 0.90950+-0.02076 | 0.91750+-0.01088 | 0.82633+-0.02014 |
| MS1MV2 | r50 | 0.99767+-0.00260 | 0.97186+-0.00652 | 0.97783+-0.00869 | 0.96067+-0.01121 | 0.92033+-0.01732 |
| MS1MV2 | r100 | 0.99383+-0.00334 | 0.96800+-0.01042 | 0.93767+-0.01724 | 0.93267+-0.01327 | 0.89150+-0.01763 |
| MS1MV2 | vit-t | 0.99717+-0.00279 | 0.92714+-0.01389 | 0.96717+-0.00727 | 0.95600+-0.01198 | 0.89950+-0.01291 |
| MS1MV2 | vit-s | 0.99767+-0.00260 | 0.95771+-0.01058 | 0.97617+-0.00972 | 0.95800+-0.01142 | 0.91267+-0.01104 |
| MS1MV2 | vit-b | 0.99817+-0.00252 | 0.94200+-0.01296 | 0.97517+-0.00858 | 0.96000+-0.01179 | 0.90967+-0.01152 |
| MS1MV2 | vit-l | 0.99750+-0.00291 | 0.93714+-0.01498 | 0.96483+-0.01031 | 0.95817+-0.01158 | 0.90450+-0.01062 |
檢測(cè)任務(wù)
對(duì)于檢測(cè)任務(wù),我們選取了Resnet50和Mobilenet0.25作為主干網(wǎng)絡(luò),Retinaface作為模型架構(gòu),以實(shí)現(xiàn)良好的人臉檢測(cè)性能。詳細(xì)結(jié)果如下表所示。
| 數(shù)據(jù)集 | 主干網(wǎng)絡(luò) | 簡(jiǎn)單 | 中等 | 困難 |
|---|---|---|---|---|
| WiderFace | mobileNet0.25 | 91.60% | 89.50% | 82.39% |
| WiderFace | ResNet50 | 95.81% | 94.89% | 90.10% |
評(píng)論
圖片
表情
