深度學習在不同領域的應用,我去,這也行!?

極市導讀
本文介紹幾款深度學習領域的有趣應用,一起來看看吧。 >>加入極市CV技術交流群,走在計算機視覺的最前沿
人工智能煉丹師既是工程師也是藝術家。隨著NLP、CV、ASR等技術的逐漸成熟,一些好玩的應用開始進入我們的生活。
比如大家多多少少聽說過的AI下圍棋、打Dota、玩德?lián)洹⒔夥匠痰鹊龋@里再分享幾個讓我咋一看直呼“好家伙”的DL應用。
1.AgileGAN變臉——字節(jié)跳動
想給自己做一個卡通風或者古風頭像嗎?
字節(jié)一位小哥哥用GAN界新秀 AgileGAN 訓練了一個換臉模型,一鍵上傳體驗瞬間換臉。工作累了可以來娛樂一把!
我們以于和偉老師為例,看看卡通、油畫、古風三種效果下,于老師的變臉效果:


除了這三種風格,還有很多其他好玩的特效,感興趣的同學可以去在線demo嘗試一下。


在線demo:https://www.agilegan.com/,paper:https://guoxiansong.github.io/homepage/paper/AgileGAN.pdf。
2.斗地主模型DouZero——快手
近日,快手 AI 平臺部的研究者用非常簡單的方法在斗地主游戲中取得了突破,幾天內就戰(zhàn)勝了所有已知的斗地主打牌機器人,并達到了人類玩家水平。而且,復現這個研究只需要一個普通的四卡 GPU 服務器。


斗地主是一款合作與競技并存的游戲,牌型組合復雜,一直以來被認為是一個極具挑戰(zhàn)的領域。
DouZero 模型創(chuàng)新性地將傳統(tǒng)的蒙特卡羅方法與深度學習相結合,提出了動作編碼機制來應付斗地主復雜的牌型組合。讓我們期待AI能否拿下下一個冠軍寶座。
paper:https://arxiv.org/abs/2106.06135,code:https://github.com/kwai/DouZero,在線demo:https://www.douzero.org/。
3.九歌寫詩機器人——清華大學
AI寫詩一直是NLP文本生成任務非常有趣的應用之一,清華大學的開源的寫詩系統(tǒng)“九歌”就是這樣一位兼賦智慧與詩意的“詩人”。
模型支持五言七言等詩歌載體,可以自定義內容主題,AI作詩后機器會自動從通順、連貫、新穎、意境等角度進行打分。


九歌—人工智能詩歌寫作系統(tǒng):http://jiuge.thunlp.org/。
4.用AI為黑白老照片上色——DeepAI
DeOldify 模型基于深度學習技術,專門用于修復&上色拍攝于一百余年前的黑白老照片、電影膠卷,甚至也能處理幾個世紀前的油畫和線條畫。
我看完幾張模型上色的照片感覺非常和諧真實,除了圖片,DeOldify 還能為黑白視頻上色。


更多項目細節(jié)查看開源倉庫:https://github.com/jantic/DeOldify。
5.基于CNN的馬兒情感識別——MIT
兩位來自MIT的朋友八成是期末要交AI大作業(yè)了,硬生生搞出了這么個玩意兒。
沒有專業(yè)人士標注,400張圖片的訓練集和80張圖片的驗證集,就直接上CNN,是不是有點迫擊炮打蚊子的味道?
他們還特地做了個交互界面,上傳圖片,哦,是一匹好奇的馬。厲害厲害。然而,我不關心馬,我目前見到的會關心馬的情緒的也只有你們倆,好了,下一個。


文章地址:https://github.com/jantic/DeOldify。
6.基于ML的面部骨骼生長預測——華沙理工大學
該工作是通過人在幼年時期頭骨的形狀,預測其成年時面相的變化。
這個工作挺有價值的,比如說對走失兒童、無名尸體的鑒別,以及醫(yī)美方面都用得上,說不定還能給中國傳統(tǒng)文化之算命提供一定的可解釋性。
但是,這個模型的效果如何要打個問號:如果以頭骨的數據作為輸入,那這個任務隱含的假設是小時候長相相似的人在成長過程中面部變化的傾向也會相似。而實際上,基因、成長環(huán)境、生活習慣等因素都對人的長相有重要的影響。
此外,如果真的想為這個任務建一個數據集,那么十年左右的數據采集周期是必不可少的,祝研究者好運啦。


文章地址:https://rxiv.org/pdf/2106.10464.pdf。
7.風格遷移——deepart
照片風格遷移,即利用一張圖片的風格元素來繪制另一張圖片的內容。你可以用最喜歡的藝術家的風格,重新繪制自己的照片,只需三步哦。


官網提供了各種供遷移參考的風格藝術照,當然,你可以用自己喜歡的照片。


官網demo:https://deepart.io/。
8.真人同聲傳譯
前兩天在公司內部的“CEO面對面”活動上,公司同時提供了中文直播頻道和英文傳譯頻道。
為了鍛煉自己的英文聽力,我切換到英文頻道,同聲傳譯者是一位聲音非常好聽的小哥哥,口音地道、翻譯專業(yè)。半個小時后,看評論區(qū)我才知道實現同聲傳譯的居然是AI模型。好家伙,這效果也太逼真了!
AI同聲傳譯得益于語音識別、機器翻譯、語音合成技術的發(fā)展與成熟,借助機器持久、高效的工作能力或許是未來同傳發(fā)展的最優(yōu)解。
深度學習領域奇特有創(chuàng)意的應用還有很多,先分享到這里,之后再陸續(xù)更新啦。小伙伴們有發(fā)現好玩的應用也歡迎來分享呀!
Reference
[1] 白鹡鸰:近期神奇機器學習應用大賞
[2] 快手開源斗地主AI,入選ICML,能否干得過「冠軍」柯潔?
[3] 人工智能在現實生活中有哪些有趣的應用?
作者名片
如果覺得有用,就請分享到朋友圈吧!
公眾號后臺回復“ICCV2021”獲取最新論文合集~

# CV技術社群邀請函 #

備注:姓名-學校/公司-研究方向-城市(如:小極-北大-目標檢測-深圳)
即可申請加入極市目標檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術交流群
每月大咖直播分享、真實項目需求對接、求職內推、算法競賽、干貨資訊匯總、與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

