這個(gè)AI項(xiàng)目,太帥了!真心好玩!
點(diǎn)擊下方“AI算法與圖像處理”,一起進(jìn)步!
重磅干貨,第一時(shí)間送達(dá)
今天分享一個(gè)算法 KalidoKit,我們看下效果:

根據(jù)真實(shí)的人物肢體、面部、手的動(dòng)作,來驅(qū)動(dòng)虛擬形象。
KalidoKit 是整合了多種算法實(shí)現(xiàn)的,F(xiàn)acemesh、Blazepose、Handpose、Holistic。
這個(gè)技術(shù)的主流應(yīng)用方向就是虛擬主播。
可以驅(qū)動(dòng)虛擬人物跳舞:

也可以像開頭的動(dòng)圖那樣,捕捉全身的動(dòng)作,面部表情、手勢(shì)等。
除了這種驅(qū)動(dòng)虛擬形象類型的,還可以發(fā)揮自己的想象力,做一些有趣的小應(yīng)用。

KalidoKit
該項(xiàng)目是基于 Tensorflow.js 實(shí)現(xiàn)的。
項(xiàng)目地址:
https://github.com/yeemachine/kalidokit
捕捉的關(guān)鍵點(diǎn)信息,可以用來驅(qū)動(dòng) 2D 和 3D 的虛擬形象,結(jié)合一些虛擬形象的驅(qū)動(dòng)引擎,即可實(shí)現(xiàn)文章開頭所展示的效果。
既可以驅(qū)動(dòng) Live2D 形象,又可以驅(qū)動(dòng) 3D VRM 形象。
這里涉及的技術(shù)點(diǎn)一篇文章講不完,今天主要講述基礎(chǔ)的關(guān)鍵點(diǎn)檢測(cè)技術(shù):人臉關(guān)鍵點(diǎn)檢測(cè)、人體姿態(tài)估計(jì)、手勢(shì)姿態(tài)估計(jì)。
人臉關(guān)鍵點(diǎn)檢測(cè)
人臉關(guān)鍵點(diǎn)檢測(cè),有稀疏的,有稠密的。
像基礎(chǔ)一點(diǎn)的,68 個(gè)關(guān)鍵點(diǎn)檢測(cè)。

一般來說,一些閉眼、頭部姿態(tài)、張閉嘴的檢測(cè),用這種簡單的 68 個(gè)關(guān)鍵點(diǎn)就夠了。
當(dāng)然,也有更加稠密的關(guān)鍵點(diǎn)檢測(cè)。

對(duì)于一些皮膚美容類的應(yīng)用場景,就需要稠密的關(guān)鍵點(diǎn)檢測(cè)算法了,成千上萬的那種。
不過算法的思想都是一樣的,回歸出這些關(guān)鍵點(diǎn)的位置坐標(biāo),通常搭配人臉檢測(cè)算法使用。
想要學(xué)習(xí)人臉關(guān)鍵點(diǎn)檢測(cè)算法的,推薦兩個(gè)入門項(xiàng)目:
https://github.com/1adrianb/face-alignment
https://github.com/ChanChiChoi/awesome-Face_Recognition
一個(gè)是基礎(chǔ)的入門項(xiàng)目,一個(gè)整合了人臉關(guān)鍵點(diǎn)的主流算法。
人體姿態(tài)估計(jì)
人體姿態(tài)估計(jì)也是計(jì)算機(jī)視覺中一個(gè)很基礎(chǔ)的問題。
從名字的角度來看,可以理解為對(duì)“人體”的姿態(tài)(關(guān)鍵點(diǎn),比如頭,左手,右腳等)的位置估計(jì)。
一般可以分為 4 種任務(wù):
單人姿態(tài)估計(jì) (Single-Person Skeleton Estimation) 多人姿態(tài)估計(jì) (Multi-person Pose Estimation) 人體姿態(tài)跟蹤 (Video Pose Tracking) 3D人體姿態(tài)估計(jì) (3D Skeleton Estimation)
簡單來說,就是對(duì)于人體骨骼關(guān)節(jié)點(diǎn)進(jìn)行檢測(cè),定位人體的姿態(tài)。

人體姿態(tài)估計(jì),應(yīng)用范圍寬廣,比如在自動(dòng)駕駛行業(yè)進(jìn)行街景中行人的姿態(tài)檢測(cè)、動(dòng)作預(yù)測(cè);在安防領(lǐng)域的行人再識(shí)別問題,特殊場景的特定動(dòng)作監(jiān)控;影視產(chǎn)業(yè)的電影特效等。
想要學(xué)習(xí)的小伙伴,可以看這整理的論文:
https://github.com/cbsudux/awesome-human-pose-estimation
手勢(shì)姿態(tài)估計(jì)
手關(guān)節(jié)更加靈活,動(dòng)作敏捷和存在自我遮擋,因此略復(fù)雜一些。

不過原理和人體姿態(tài)估計(jì)類似。

除了這種常規(guī)的手勢(shì)識(shí)別,也可以用來做一些特效。

其實(shí),很多這種人體特效,位置的定位,都是借助這些關(guān)鍵點(diǎn)實(shí)現(xiàn)的。
同上,想要學(xué)習(xí),可以看這份整合的資料:
https://github.com/xinghaochen/awesome-hand-pose-estimation
總結(jié)
本文介紹了一些基礎(chǔ)的算法,并推薦了一些學(xué)習(xí)資料,比較基礎(chǔ)。
交流群
歡迎加入公眾號(hào)讀者群一起和同行交流,目前有美顏、三維視覺、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競賽等微信群
個(gè)人微信(如果沒有備注不拉群!) 請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱
下載1:何愷明頂會(huì)分享
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經(jīng)典工作的總結(jié)分析
下載2:終身受益的編程指南:Google編程風(fēng)格指南
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):c++,即可下載。歷經(jīng)十年考驗(yàn),最權(quán)威的編程規(guī)范!
下載3 CVPR2021 在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):CVPR,即可下載1467篇CVPR?2020論文 和 CVPR 2021 最新論文

