深度學習在不同領(lǐng)域的應(yīng)用,我去,這也行!?
點擊上方“視學算法”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
導(dǎo)讀
本文介紹幾款深度學習領(lǐng)域的有趣應(yīng)用,一起來看看吧。
人工智能煉丹師既是工程師也是藝術(shù)家。隨著NLP、CV、ASR等技術(shù)的逐漸成熟,一些好玩的應(yīng)用開始進入我們的生活。
比如大家多多少少聽說過的AI下圍棋、打Dota、玩德?lián)洹⒔夥匠痰鹊龋@里再分享幾個讓我咋一看直呼“好家伙”的DL應(yīng)用。
1.AgileGAN變臉——字節(jié)跳動
想給自己做一個卡通風或者古風頭像嗎?
字節(jié)一位小哥哥用GAN界新秀 AgileGAN 訓(xùn)練了一個換臉模型,一鍵上傳體驗瞬間換臉。工作累了可以來娛樂一把!
我們以于和偉老師為例,看看卡通、油畫、古風三種效果下,于老師的變臉效果:


除了這三種風格,還有很多其他好玩的特效,感興趣的同學可以去在線demo嘗試一下。


在線demo:https://www.agilegan.com/,paper:https://guoxiansong.github.io/homepage/paper/AgileGAN.pdf。
2.斗地主模型DouZero——快手
近日,快手 AI 平臺部的研究者用非常簡單的方法在斗地主游戲中取得了突破,幾天內(nèi)就戰(zhàn)勝了所有已知的斗地主打牌機器人,并達到了人類玩家水平。而且,復(fù)現(xiàn)這個研究只需要一個普通的四卡 GPU 服務(wù)器。


斗地主是一款合作與競技并存的游戲,牌型組合復(fù)雜,一直以來被認為是一個極具挑戰(zhàn)的領(lǐng)域。
DouZero 模型創(chuàng)新性地將傳統(tǒng)的蒙特卡羅方法與深度學習相結(jié)合,提出了動作編碼機制來應(yīng)付斗地主復(fù)雜的牌型組合。讓我們期待AI能否拿下下一個冠軍寶座。
paper:https://arxiv.org/abs/2106.06135,code:https://github.com/kwai/DouZero,在線demo:https://www.douzero.org/。
3.九歌寫詩機器人——清華大學
AI寫詩一直是NLP文本生成任務(wù)非常有趣的應(yīng)用之一,清華大學的開源的寫詩系統(tǒng)“九歌”就是這樣一位兼賦智慧與詩意的“詩人”。
模型支持五言七言等詩歌載體,可以自定義內(nèi)容主題,AI作詩后機器會自動從通順、連貫、新穎、意境等角度進行打分。


九歌—人工智能詩歌寫作系統(tǒng):http://jiuge.thunlp.org/。
4.用AI為黑白老照片上色——DeepAI
DeOldify 模型基于深度學習技術(shù),專門用于修復(fù)&上色拍攝于一百余年前的黑白老照片、電影膠卷,甚至也能處理幾個世紀前的油畫和線條畫。
我看完幾張模型上色的照片感覺非常和諧真實,除了圖片,DeOldify 還能為黑白視頻上色。


更多項目細節(jié)查看開源倉庫:https://github.com/jantic/DeOldify。
5.基于CNN的馬兒情感識別——MIT
兩位來自MIT的朋友八成是期末要交AI大作業(yè)了,硬生生搞出了這么個玩意兒。
沒有專業(yè)人士標注,400張圖片的訓(xùn)練集和80張圖片的驗證集,就直接上CNN,是不是有點迫擊炮打蚊子的味道?
他們還特地做了個交互界面,上傳圖片,哦,是一匹好奇的馬。厲害厲害。然而,我不關(guān)心馬,我目前見到的會關(guān)心馬的情緒的也只有你們倆,好了,下一個。


文章地址:https://github.com/jantic/DeOldify。
6.基于ML的面部骨骼生長預(yù)測——華沙理工大學
該工作是通過人在幼年時期頭骨的形狀,預(yù)測其成年時面相的變化。
這個工作挺有價值的,比如說對走失兒童、無名尸體的鑒別,以及醫(yī)美方面都用得上,說不定還能給中國傳統(tǒng)文化之算命提供一定的可解釋性。
但是,這個模型的效果如何要打個問號:如果以頭骨的數(shù)據(jù)作為輸入,那這個任務(wù)隱含的假設(shè)是小時候長相相似的人在成長過程中面部變化的傾向也會相似。而實際上,基因、成長環(huán)境、生活習慣等因素都對人的長相有重要的影響。
此外,如果真的想為這個任務(wù)建一個數(shù)據(jù)集,那么十年左右的數(shù)據(jù)采集周期是必不可少的,祝研究者好運啦。


文章地址:https://rxiv.org/pdf/2106.10464.pdf。
7.風格遷移——deepart
照片風格遷移,即利用一張圖片的風格元素來繪制另一張圖片的內(nèi)容。你可以用最喜歡的藝術(shù)家的風格,重新繪制自己的照片,只需三步哦。


官網(wǎng)提供了各種供遷移參考的風格藝術(shù)照,當然,你可以用自己喜歡的照片。


官網(wǎng)demo:https://deepart.io/。
8.真人同聲傳譯
前兩天在公司內(nèi)部的“CEO面對面”活動上,公司同時提供了中文直播頻道和英文傳譯頻道。
為了鍛煉自己的英文聽力,我切換到英文頻道,同聲傳譯者是一位聲音非常好聽的小哥哥,口音地道、翻譯專業(yè)。半個小時后,看評論區(qū)我才知道實現(xiàn)同聲傳譯的居然是AI模型。好家伙,這效果也太逼真了!
AI同聲傳譯得益于語音識別、機器翻譯、語音合成技術(shù)的發(fā)展與成熟,借助機器持久、高效的工作能力或許是未來同傳發(fā)展的最優(yōu)解。
深度學習領(lǐng)域奇特有創(chuàng)意的應(yīng)用還有很多,先分享到這里,之后再陸續(xù)更新啦。小伙伴們有發(fā)現(xiàn)好玩的應(yīng)用也歡迎來分享呀!
Reference
[1] 白鹡鸰:近期神奇機器學習應(yīng)用大賞
[2] 快手開源斗地主AI,入選ICML,能否干得過「冠軍」柯潔?
[3] 人工智能在現(xiàn)實生活中有哪些有趣的應(yīng)用?
作者名片
如果覺得有用,就請分享到朋友圈吧!

點個在看 paper不斷!
