今天這個(gè)「主播」,有點(diǎn)不一樣!

??新智元報(bào)道??

??新智元報(bào)道??
編輯:好困
【新智元導(dǎo)讀】萬(wàn)物皆可播,人人皆主播。不過(guò)現(xiàn)在直播間里和你對(duì)話的可不一定是個(gè)「真人」了哦。
請(qǐng)看上面這兩位長(zhǎng)相差不多的主播,像不像是一對(duì)雙胞胎?
但實(shí)際上,她們是「同一個(gè)人」!
至于原因,這里先賣個(gè)關(guān)子。
半夜還要直播,太「費(fèi)人」了吧
我們先說(shuō)說(shuō)直播帶貨這件事。
顧名思義,重點(diǎn)就是為了「帶貨」。
但每次都要卡著點(diǎn)進(jìn)去,一不小心就會(huì)錯(cuò)過(guò)。
一來(lái)二去,可能也就不想再看了。
商家們似乎也發(fā)現(xiàn)了這個(gè)問(wèn)題,于是虛擬帶貨主播就應(yīng)運(yùn)而生了。
7x24小時(shí)不間斷,啥時(shí)候點(diǎn)進(jìn)去都可以。

然而問(wèn)題又來(lái)了,想要獲得好的表現(xiàn),基本只能靠「真人驅(qū)動(dòng)」,原理和我們熟知的「虛擬偶像」差不太多。
屏幕中看起來(lái)好像是一位美少女坐在桌子前面帶貨,實(shí)際上是一位演員置身于偌大的「動(dòng)捕房」里,穿戴一身繁瑣的設(shè)備來(lái)實(shí)現(xiàn)表情和動(dòng)作的「復(fù)刻」。除此之外,還需要演員自己進(jìn)行配音。
這要是來(lái)個(gè)「007」工作制……

而另一種方法倒是實(shí)現(xiàn)了「全自動(dòng)」,但是目前多數(shù)還停留在自說(shuō)自話的階段。
比如你想咨詢一號(hào)寶貝的信息,但是人家正按照設(shè)定的程序跳舞,還完全沒(méi)有要停下來(lái)的意思。
而造成現(xiàn)在這種「食之無(wú)味,棄之可惜」的狀況,和定制虛擬人形象、維護(hù)或租用動(dòng)捕設(shè)備等環(huán)節(jié)的費(fèi)用太高有直接聯(lián)系。
要是能有一個(gè)價(jià)格便宜,操作起來(lái)也簡(jiǎn)單的系統(tǒng)就好了。
直播「雙胞胎」大揭秘!
說(shuō)到這里,你還記得最開(kāi)始提到的那對(duì)「雙胞胎」嗎?
她的「孿生」虛擬人就是借助科大訊飛的AI虛擬人交互平臺(tái)上訓(xùn)練出來(lái)的,而且只需采集0.5小時(shí)的視頻就可以了。
如果你仔細(xì)觀察下面這張動(dòng)圖的話,甚至可以從虛擬人的唇語(yǔ)中讀出她說(shuō)的是:「比個(gè)小愛(ài)心」。
?

?
如此逼真的實(shí)現(xiàn)靠的就是訊飛基于大數(shù)據(jù)多模態(tài)預(yù)訓(xùn)練的口唇驅(qū)動(dòng)框架,它在保證高真實(shí)度的口唇合成效果的同時(shí),可以實(shí)現(xiàn)不同語(yǔ)種以及不同方言的口唇驅(qū)動(dòng)。
此外,在表情和動(dòng)作的驅(qū)動(dòng)方面,基于情感的語(yǔ)義空間可以實(shí)現(xiàn)從語(yǔ)音到表情動(dòng)作的上的情感表現(xiàn),也就是讓情感貫穿于虛擬人的交互過(guò)程之中。
雖說(shuō)叫「口唇驅(qū)動(dòng)」,但實(shí)際上是利用AI對(duì)整個(gè)人臉區(qū)域進(jìn)行編輯的,除了口型和發(fā)音是一一對(duì)應(yīng)的以外,其他部位的肌肉以及下巴也是要同步跟著移動(dòng)的。
如果覺(jué)得用視頻訓(xùn)練太麻煩了的話,還可以用科大訊飛的融合人技術(shù)像游戲里那樣捏一個(gè)新的出來(lái)。

這套系統(tǒng)可根據(jù)不同應(yīng)用場(chǎng)景和審美需求,支持對(duì)眉眼、鼻子、嘴巴進(jìn)行高自由度編輯和融合,并供不同性別、職業(yè)、服裝等豐富的融合人臉資源。
僅需編輯單張人臉即可實(shí)現(xiàn)完整視頻的驅(qū)動(dòng),其中采用可控編輯人臉區(qū)域創(chuàng)造的全新虛擬人臉。
除了這種2D真人以外,科大訊飛在3D虛擬形象的構(gòu)建上也結(jié)合了基于單張照片的人臉重建和表情遷移,并以此實(shí)現(xiàn)了3D可驅(qū)動(dòng)個(gè)性化虛擬形象的快速生成,而且未來(lái)還將向全身擴(kuò)展。
?
現(xiàn)在,臉已經(jīng)「捏」好了,接下來(lái)要做的就是「教」虛擬人說(shuō)話了。
這對(duì)于深耕語(yǔ)音技術(shù)23年訊飛來(lái)說(shuō),可以稱得上是「老本行」。
想「復(fù)刻」自己的聲音?小case!而且還能順便讓虛擬人用你的聲音說(shuō)方言,講外語(yǔ)。
效果的話,來(lái)感受一段東北老鐵版的「虛擬冰冰」吧!
當(dāng)然了,英語(yǔ)也同樣不在話下。
而這只需要上傳一段10-15分鐘的錄音數(shù)據(jù)到訊飛開(kāi)放平臺(tái),機(jī)器就可以快速學(xué)習(xí)并生成獨(dú)一無(wú)二的語(yǔ)音合成音庫(kù)。
相較于以往整個(gè)訓(xùn)練和調(diào)優(yōu)過(guò)程需要花費(fèi)數(shù)月時(shí)間的標(biāo)準(zhǔn)流程,聲音復(fù)刻讓聲音快速定制應(yīng)用成為現(xiàn)實(shí)。
在到了這一步,我們已經(jīng)搞定了虛擬人的形象和聲音,那么之后要解決的問(wèn)題就是怎么用虛擬人進(jìn)行直播了。
虛擬人如何才能吸粉?
目前來(lái)說(shuō),真人主播和中之人能吸引粉絲的主要原因便是背后的那個(gè)「人」。
不管是介紹產(chǎn)品時(shí)候的「哦買噶,買它!」,還是及時(shí)準(zhǔn)確地回答公屏上的問(wèn)題,都讓觀眾有了切實(shí)的參與感,而這是很多全自動(dòng)虛擬人主播并不具備的。
那如果能開(kāi)發(fā)一套能兼顧真人的優(yōu)點(diǎn)的同時(shí),又能簡(jiǎn)化流程、降低成本的直播系統(tǒng),又會(huì)如何呢?
話不多說(shuō),先上效果看看。
和「中之人」類似,科大訊飛AI虛擬人直播系統(tǒng)的「人工播」模式,也是由真人主播進(jìn)行配音的。
不過(guò),在設(shè)備方面只用準(zhǔn)備一臺(tái)電腦和一個(gè)麥克風(fēng)就可以了,無(wú)需繁瑣的「動(dòng)捕套裝」。
其中的面部表情通過(guò)口唇驅(qū)動(dòng)框架實(shí)現(xiàn),而動(dòng)作上的互動(dòng)則可以進(jìn)行個(gè)性化的定制,或者直接使用豐富的內(nèi)置動(dòng)作庫(kù)。
如此看來(lái),這個(gè)「Lite版」的維護(hù)成本和使用時(shí)的工作量,比傳統(tǒng)意義上的中之人能少不止一個(gè)量級(jí)。
?

?
科大訊飛AI虛擬人直播系統(tǒng)更厲害的一點(diǎn)在于,真人主播甚至不需要自己進(jìn)行配音。
你要做的就是把每個(gè)產(chǎn)品的介紹以及其他環(huán)節(jié)的文字稿準(zhǔn)備好,剩下的交給系統(tǒng)就可以了。
在「腳本播」這個(gè)模式下,虛擬人終于做到了一個(gè)主播本應(yīng)該做的事情。
沒(méi)錯(cuò),說(shuō)的就是和觀眾的「互動(dòng)」。
畢竟有的時(shí)候主播沒(méi)有辦法面面俱到地介紹一款產(chǎn)品,這時(shí),不管是自己還是看別人提問(wèn),都可以便捷地讓觀眾獲得更多地信息。
從直覺(jué)上來(lái)講,通常只有用戶了解了某一款產(chǎn)品之后,才可能會(huì)下單購(gòu)買。
而在科大訊飛AI虛擬人直播系統(tǒng)中,運(yùn)營(yíng)僅需點(diǎn)擊已經(jīng)準(zhǔn)備好的內(nèi)容,之后虛擬人會(huì)即刻中斷正在進(jìn)行的介紹,轉(zhuǎn)而回答觀眾的提問(wèn)。
雖說(shuō)現(xiàn)在這種方式「人工」程度相對(duì)較高,但在即將發(fā)布的新版本中,系統(tǒng)可以通過(guò)AI對(duì)問(wèn)題進(jìn)行識(shí)別,然后自動(dòng)給出相應(yīng)的回答。
在操作上,科大訊飛的AI虛擬人直播系統(tǒng)為各家的直播助手都提供了支持。
此外,也可以利用OBS通用推流方案實(shí)現(xiàn)全面的覆蓋。
?

?
為何要用虛擬人直播?
說(shuō)回到直播帶貨上來(lái),在這個(gè)領(lǐng)域內(nèi)流傳一句話:「萬(wàn)物皆可播,人人皆主播?!?/span>
憑借著優(yōu)惠的價(jià)格和陪伴式的體驗(yàn),直播帶貨也確實(shí)俘獲了越來(lái)越多消費(fèi)者的心。
據(jù)統(tǒng)計(jì),我國(guó)電商直播用戶規(guī)模為3.84億,占網(wǎng)民整體的38%。另?yè)?jù)企查查數(shù)據(jù)顯示,全國(guó)共有1.6萬(wàn)家電商直播相關(guān)企業(yè),其中2021年新注冊(cè)8364家。
如今,不僅農(nóng)土特產(chǎn)、口紅、面膜等小件商品「走」進(jìn)直播間,還擴(kuò)展到家具、汽車甚至房子。
那么問(wèn)題來(lái)了,明明用真人就可以做到的事情,為什么要用虛擬人呢?
的確,直播產(chǎn)業(yè)的發(fā)展催生出了無(wú)數(shù)的機(jī)會(huì),但同樣也帶來(lái)了日益激烈的競(jìng)爭(zhēng)。
在黃金時(shí)段,也就是流量最高的時(shí)候,每個(gè)商家都會(huì)派出自己最強(qiáng)的主播,盡可能多的進(jìn)行銷售轉(zhuǎn)化。

?
科大訊飛的一站式解決方案


