能看的三级网站,色婷婷精品视频,欧美日韩高清一区二区三区,俺也去com,午夜草视频,中文字幕在线观看欧美,日韩男女操逼,亚洲综合免费观看高清完整版在线观

量子位?| 行早

你敢信，派大星當眾宣稱自己是鋼鐵俠，漫威宇宙和比基尼海灘夢幻聯(lián)動：

I am Iron Man！

這深沉憨厚又有點喜感的嗓音，是派大星本星沒錯了。

而小扎也瘋狂亂入，直接搶了派大星的臺詞，喊海綿寶寶去抓水母：

hi，spongebob，shall we go to catch jellyfishes?

沒錯，這又是AI的杰作。

這個名叫FakeYou的語音偽造模型，最近火爆到服務(wù)器都被擠掛掉了：

像這位網(wǎng)友一樣給馬男波杰克寫段臺詞：

suck a?*. why are you still here?! did you eat my muffin? you are a worthless piece of no good shit who deserves to die. what are YOUU doing here? what are you doing here.

一鍵就可以還原他“致郁”的聲音：

這“What are youuuu doing”的發(fā)音，確實夠傳神了：

目前上傳的人物語音模型已經(jīng)有很多，包括海綿寶寶、摩根·弗里曼、辛普森一家、馬男波杰克、滅霸等等。

demo在線可玩，快來試試~

操作也很簡單，只需兩步：

在圖中第一個紅框中的下拉菜單中選擇你喜歡的人物，然后在下面的文本框中輸入你希望TA說的話，再點擊“Speak”就ok了~

另外，如果你還想讓TA對上口型，F(xiàn)akeYou也在線提供了相關(guān)功能。選擇不同的視頻model，上傳音頻文件就可以了：

FakeYou如何Fake

那FakeYou是怎么實現(xiàn)文本轉(zhuǎn)語音和對口型的呢？

對于文本轉(zhuǎn)語音的任務(wù)，F(xiàn)akeYou提到了一系列的模型，主要是其中值得一提的是MelGAN。

它的整體結(jié)構(gòu)也比較簡單，工作流是這樣的：

首先將輸入的文本轉(zhuǎn)化為梅爾聲譜圖，然后再利用GAN去學習圖中的特征，提取聲音的信息。

最后再通過傅里葉逆變換還原出原始聲波。

而對口型任務(wù)使用的則是Wav2Lip模型，與之前的對口型模型的區(qū)別在于，Wav2Lip使用預訓練的判別器，在檢測唇同步時已經(jīng)相當準確。

并將口型的真值和遮住口型的部分輸入網(wǎng)絡(luò)，用殘差網(wǎng)絡(luò)相連。

同時還使用了視覺判別器來提高視覺質(zhì)量和同步精度，進一步提高模型質(zhì)量。

FakeYou創(chuàng)作者

FakeYou的創(chuàng)作者主要是畢業(yè)于南方理工州立大學Brandon Thomas，他是一名來自亞特蘭大的工程師。

自這款demo改名為FakeYou之后，就受到很多網(wǎng)友的喜愛。因此有很多社區(qū)中的網(wǎng)友也來貢獻“聲音”。目前FakeYou中已經(jīng)有幾百個用于制作的語音模型。

如果沒能找到合適的人物語音模型，也可以自己添加，來豐富FakeYou。

如果你也有想讓影視或者動漫中的人物說出你想聽的話，可以參考文末的在線demo鏈接~

參考鏈接：

[1]https://fakeyou.com/
[2]https://arxiv.org/abs/1910.06711

·················END·················

AI派大星，在線FakeYou，爆火！

量子位?| 行早

FakeYou如何Fake

FakeYou創(chuàng)作者

推薦閱讀