Real-Time Voice Cloning克隆語音并實時生成任意語音
Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis(SV2TTS)”論文的實現,這是一個三階深度學習框架,允許從幾秒鐘的音頻中創(chuàng)建一個數字化的語音,并使用它來調節(jié)訓練的“文本轉語音”模型,以推廣到新的聲音。
此項目中帶有一個實時工作的聲碼器。
評論
圖片
表情
