<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          危!我用python克隆了女朋友的聲音!

          共 1427字,需瀏覽 3分鐘

           ·

          2021-12-24 18:11

          大家好,我是 寶器。

          今天,給大家介紹一個(gè)算法。

          AI 算法 5 秒鐘,就能克隆你的聲音,你信嗎?

          聽(tīng)聽(tīng)這段音頻,猜猜看是 AI 合成音,還是真人錄音?

          答案是:AI 合成。

          這個(gè)人的原始聲音在這里:

          你給這個(gè) AI 克隆聲音的算法打幾分?

          上述兩個(gè)音頻,算法運(yùn)行起來(lái)的效果:


          錄制一段音頻,就可以根據(jù)輸入的文字,5s 即可自動(dòng)生成對(duì)應(yīng)的合成音。

          突然有個(gè)大膽的想法,你說(shuō)女朋友要是哪天突然不承認(rèn)自己說(shuō)過(guò)了某句話,我就給她造一份!

          兄弟們,我做的對(duì)嗎?

          MockingBird

          這個(gè)算法是基于比較著名的 Real Time Voice Cloning 實(shí)現(xiàn)的。

          MockingBird 是最近開(kāi)源的中文版。

          論文的名字是:

          Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis

          簡(jiǎn)單介紹下:

          算法分為三個(gè)模塊:encoder模塊、systhesis模塊、vocoder模塊。

          • encoder模塊將說(shuō)話人的聲音轉(zhuǎn)換成人聲的數(shù)字編碼(speaker embedding)
          • synthesis 模塊將文本轉(zhuǎn)換成梅爾頻譜(mel-spectrogram)
          • vocoder模塊將梅爾頻譜(mel-spectrogram)轉(zhuǎn)換成(波形)waveform

          具體的算法原理,大家可以先看論文:

          https://arxiv.org/pdf/1806.04558.pdf

          論文還沒(méi)詳細(xì)看,等我研究好后,后面有機(jī)會(huì)再發(fā)吧。

          今天主要聊聊,這個(gè)算法怎么玩。

          項(xiàng)目地址:https://github.com/babysor/MockingBird

          有深度學(xué)習(xí)基礎(chǔ)的話,這個(gè)應(yīng)該不難。

          就是部署環(huán)境,分四步:

          • Anaconda 配置 Pytorch 開(kāi)發(fā)環(huán)境
          • 根據(jù)項(xiàng)目 requirements.txt 安裝第三方庫(kù)依賴(lài)
          • 下載權(quán)重文件
          • 下載訓(xùn)練集,這個(gè)幾十G,有點(diǎn)大

          具體的配置方法,直接看這里:

          https://github.com/babysor/MockingBird/blob/main/README-CN.md

          環(huán)境搭建的方法,可以參考我寫(xiě)過(guò)的兩篇文章:

          別再折騰開(kāi)發(fā)環(huán)境了,一勞永逸的搭建方法

          語(yǔ)義分割基礎(chǔ)與環(huán)境搭建

          都搞定了,就可以運(yùn)行代碼了。

          有兩種模式可以啟動(dòng),Web 模式和工具箱模式。

          在項(xiàng)目根目錄運(yùn)行:

          python web.py

          即可開(kāi)啟 Web ,打開(kāi)地址 http://localhost:8080 就能操作了。

          這個(gè)界面比較簡(jiǎn)陋,建議使用工具箱模式。

          python demo_toolbox.py -d <datasets_root>

          datasets_root就是下載好的數(shù)據(jù)集的地址。

          總結(jié)

          Enjoy it!

          喜歡的話,來(lái)個(gè)再看嘍~

          如果人多的話,后面我再出個(gè)詳細(xì)的算法原理剖析和訓(xùn)練教程。

          我們下期見(jiàn)~

          ·················END·················

          推薦閱讀

          1. 我在字節(jié)做了哪些事

          2. 寫(xiě)給所有數(shù)據(jù)人。

          3. 從留存率業(yè)務(wù)案例談0-1的數(shù)據(jù)指標(biāo)體系

          4. 數(shù)據(jù)分析師的一周

          5. 超級(jí)菜鳥(niǎo)如何入門(mén)數(shù)據(jù)分析?


          歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」

          瀏覽 49
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  7777偷窥盗摄视频 | 国产精品15p | 三区无码 | 天天躁日日躁AAAXXⅩ | 老妇人一区二区三区 |