<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          這些 AI 算法太強(qiáng)了,我有個(gè)大膽的想法!

          共 1500字,需瀏覽 3分鐘

           ·

          2020-09-12 19:20

          點(diǎn)擊上方“Jack Cui”,選擇“加為星標(biāo)

          第一時(shí)間關(guān)注技術(shù)干貨!



          好久沒(méi)有推薦有趣的算法了,今天 Jack 再帶大家逛逛「AI 樂(lè)園」,看看最近新出了哪些新奇好玩的 AI 算法。

          1


          深度估計(jì)

          不知你有沒(méi)有發(fā)現(xiàn),最新的視覺(jué)技術(shù)研究,多了很多 3D 相關(guān)的工作。

          深度估計(jì)就是其中之一。

          Facebook 的最新一項(xiàng)研究,根據(jù)視頻幀序列,就可以穩(wěn)定地估計(jì)圖像的深度


          圖像深度信息有了,就可以做很多有意思的視頻特效:

          水漫金山」、「漫天飛雪」、「金星環(huán)繞」。


          論文提出了一種重建單目視頻中所有像素密集、幾何一致性深度估計(jì)算法。

          比以往的單目深度估計(jì)方法具有更高的精度,同時(shí)結(jié)果更加穩(wěn)定。

          代碼開(kāi)源,盤(pán)它

          項(xiàng)目地址:
          https://github.com/facebookresearch/consistent_depth

          2


          Wav2Lip

          AI 技術(shù)可以撐起鬼畜視頻的一片天。

          Wav2Lip,算法如其名,Wav 音頻轉(zhuǎn)嘴唇 Lip。

          就是字面的意思,給算法一個(gè)音頻文件,算法可以讓視頻里的人物,將這段話自然地念出來(lái)


          任何人物身份,甚至包括卡通人物,任何語(yǔ)音和語(yǔ)言,都可以將口型視頻高精度同步到任何目標(biāo)語(yǔ)音。

          這位老哥甚至還為小白量身打造了網(wǎng)頁(yè) Demo,上傳音頻和視頻就可以體驗(yàn)。

          網(wǎng)頁(yè)地址:
          https://bhaasha.iiit.ac.in/lipsync/

          對(duì)于有一定編程基礎(chǔ)的,可以去 GitHub 下載源代碼,只要有你想鬼畜的人的照片或者視頻,再輸入一段文字,就能合成你想要的視頻了。

          比如來(lái)一段「特朗普熱愛(ài)中國(guó)宣言」,是不是就突然來(lái)了靈感。

          天啊,我腦海里浮現(xiàn)了好多大膽的想法

          有個(gè) Wav2Lip 還不算完,還有個(gè) Lip2Wav

          我們可以理解為 AI “讀唇術(shù)”。

          視頻的聲音沒(méi)了,Lip2Wav 幫你生成。

          根據(jù)畫(huà)面嘴唇的動(dòng)作,進(jìn)行“讀唇”,給你音頻結(jié)果。



          值得注意的是,Lip2Wav 和 B站 那些機(jī)械風(fēng)格的鬼畜調(diào)音不一樣。

          這個(gè) AI 效果炸裂,你幾乎感覺(jué)不到是機(jī)器配音,就像人類(lèi)在發(fā)言一樣。

          算法原理就是根據(jù)面部特征,對(duì)唇部進(jìn)行編碼,再使用 LSTM 進(jìn)行音頻合成。


          Wav2Lip 和 Lip2Wav 都有開(kāi)源代碼。

          來(lái)吧,翻牌子,喜歡哪個(gè)點(diǎn)哪個(gè)。

          Wav2Lip 項(xiàng)目地址:
          https://github.com/Rudrabha/Wav2Lip

          Lip2Wav 項(xiàng)目地址:
          https://github.com/Rudrabha/Lip2Wav

          3


          HiFiC

          沒(méi)做過(guò)網(wǎng)站的朋友可能不知道。

          圖片的大小,太影響網(wǎng)頁(yè)的加載速度了。

          過(guò)多過(guò)大的圖片,可能讓你的頁(yè)面加載,就像老太太吃硬餅一樣,得慢慢磨。

          還在為圖像加載犯愁嗎?

          最新的好消息是,谷歌團(tuán)隊(duì)采用了一種 GANs 與基于神經(jīng)網(wǎng)絡(luò)的壓縮算法相結(jié)合的圖像壓縮方式HiFiC,在碼率高度壓縮的情況下,仍能對(duì)圖像高保真還原。

          下面是這種算法展現(xiàn)出來(lái)的圖像與 JPG 格式圖像的對(duì)比。


          左邊是 HiFiC 算法壓縮效果,右邊是同等體積 JPG 格式圖片的效果。

          可以非常明顯地看到,HiFiC 算法壓縮的圖片要清晰太多了。

          代碼還沒(méi)有開(kāi)源,但是作者老哥說(shuō)「快了,快了,這次一定!」

          想要體驗(yàn)的小伙伴,直接網(wǎng)頁(yè)走起!

          項(xiàng)目地址:
          https://hific.github.io/

          4


          總結(jié)

          文章寫(xiě)完,已經(jīng)凌晨1點(diǎn)多了,肝得我腦瓜仁疼。

          轉(zhuǎn)發(fā)分享點(diǎn)贊三連有沒(méi)有?這次一定
          瀏覽 54
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  www.免费看黄色 | 使劲操影院 | 人人爱天天摸 | 成人做爰黄 片视频真人 | 国产做爰视频免费播放 |