小姐姐終于開口了!AI殺瘋了!
大家好,我是 Jack。
CVPR、SIGGRAPH 等各種計算機視覺的頂級會議,在 6 月份都陸續(xù)結束了。
話說,小伙伴們都斬獲了幾篇論文?
今天繼續(xù)給大家?guī)硪恍┯腥さ?AI 算法。
ml-talking-face
根據(jù)文字,生成說話的面孔,還能帶肢體動作。
比如,輸入中文:
我愛你

語言選擇韓語,然后選擇語速、動作、視頻背景。
生成的視頻效果:
選擇成中文,動作選擇伸兩只手,我們再看下效果:
也可以輸入我們耳熟能詳?shù)模?/p>
效果是這樣的:
再比如:

效果是這樣的:
算法支持的語言有:漢語、英語、日語、韓語,從效果看還都挺標準的。
這個算法是一個 CVPR 的最新論文的 Demo 效果,可以在線體驗。
體驗地址:
https://huggingface.co/spaces/CVPR/ml-talking-face
論文地址:
https://arxiv.org/abs/2205.06421
算法的框架是這樣的:

使用谷歌翻譯 API 先對輸入文字進行翻譯,生成目標語言,然后使用 TTS 算法,就是一個 Text-To-Speech 算法,生成對應的音頻,再根據(jù)音頻,生成視頻。
音頻生成視頻的算法,我之前寫過,比如 LSP 算法:
不過他們用的不是這個,是一個類似算法 Wav2Lip。
https://github.com/Rudrabha/Wav2Lip
說實話,這套系統(tǒng)逐漸成熟,客服這類的崗位,就會逐漸被代替了。
當然,也要謹防這類技術的詐騙。
比如,眼見為實,耳聽為虛已經(jīng)是過去式了,現(xiàn)在眼見也未必為真。
AI 算法,視頻都能給你生成了。
Text2Human
也是一篇頂會的論文,直接上效果:

算法如其名,Text2Human。
根據(jù)文字描述,生成不同衣著的人。
A man wears a short-sleeve and short rompers with denim meterials.
用法就是:描述一下性別和穿的衣服,算法就能自動生成對應的圖片。
可以選擇不同的姿態(tài):

然后輸入描述即可生成對應的圖片。
這個算法已經(jīng)開源,作者還做了一個 UI 界面。

項目地址:
https://github.com/yumingj/Text2Human
不過這個需要一些編程基礎才能體驗,畢竟環(huán)境搭建起來也要花費一陣子。
當然,想省事,也可以在線體驗:
https://huggingface.co/spaces/hysts/Text2Human
這類算法也挺有意思,擴展一下,就是在線試衣。
將生成的人物照片,指定為固定的人,比如自己。
足不出戶,就能使用手機 APP 在線試穿各種衣服。
最后
好了,干貨分享就聊這么多。
最后再來個福利吧:

這本書是我一位朋友的新作,4月份的時候,寫完書我就搶先看了電子版,然后寫了推薦語。

出書很不容易,知識點要成系統(tǒng),不像寫個公眾號文章,今天寫點啥,明天想寫點啥,不用太拘束。
所以我認真寫了個推薦語,支持一下。

Python 自動化辦公,很適合想要入門,內容非常豐富,各種實戰(zhàn)案例。

零基礎想要學習,提高辦公效率的小伙伴,可以看一看。
我跟朋友要了20本書,免費送給我的讀者朋友。
抽獎就不搞那么復雜了,直接看留言吧。
第 1、2、5、8、13、15、18、20、21、25、28、30、31、33、35、37、40、42、45、50 樓可以免費獲得這本書。
就按照明晚(7.18)凌晨 12 點留言的樓層定了,點贊越多越靠前。
當然,不想抽獎的,也可以直接買,因為是新書剛上市,最便宜。
現(xiàn)在優(yōu)惠力度很大,京東 5 折,定價 129 元,現(xiàn)在 64.5 元就能拿下。
問了一下,半價活動還有最后兩天,大家可以先下手,萬一中獎,咱也可以留中獎的這本書,不虧~
掃碼即可購買:
好了,今天就聊這么多吧~
我是 Jack,我們下期見!

