又整新活,AI 殺麻了!
大家好,又是一個(gè)整活的周末。
年底了,各種有趣好玩的算法,突然多了起來(lái)。
今天跟大家聊聊三個(gè)新出的 AI 算法,每一個(gè)算法都可以單獨(dú)寫一篇文章。
不過(guò)為了大家看得過(guò)癮,一次寫全吧。
一、Latent Diffusion
超分辨率重建算法,再添一員!
之前寫過(guò)一個(gè)在二次元圖片上表現(xiàn)很好的 Real-ESRGAN 算法。

這個(gè)算法,也是我上期視頻里投票最高的,想讓我做成視頻教程的算法之一。
今天介紹的 Latent Diffusion 算法功能類似,不過(guò)主要針對(duì)的是真實(shí)場(chǎng)景。
我們看下效果:

這個(gè)效果,真的很頂了!
當(dāng)然這個(gè)算法不僅僅是超分,還能進(jìn)行 inpainting。

可以 P 掉我們圖片里想要去掉的東西。
這就有一個(gè)比較不錯(cuò)的場(chǎng)景,比如情侶拍照,想去掉旁邊的路人,就可以使用這個(gè)算法。
不過(guò)算法的效果是否穩(wěn)定,就得調(diào)研看看了。

剛剛開(kāi)源 5 天,新鮮熱乎。
項(xiàng)目地址:
https://github.com/CompVis/latent-diffusion
二、GLIDE
今年年初的 DALL-E 想必大家都知道,當(dāng)時(shí)我也寫過(guò)一期硬核的算法講解文章。
最近,OpenAI 又有了新動(dòng)作,開(kāi)源了 35 億參數(shù)的新模型 GLIDE。
我們先看其中一項(xiàng)功能,文字轉(zhuǎn)圖片任務(wù):就是根據(jù)一段文字描述,生成對(duì)應(yīng)描述的圖片。
這回效果很驚艷,舉個(gè)例子。
a hedgehog using a calculator
刺猬使用計(jì)算器,這是多么離譜的輸入,但是結(jié)果表現(xiàn)很不錯(cuò)。

a corgi wearing a red bowtie and a purple party hat
一只戴著紅色蝴蝶結(jié)和紫色派對(duì)帽的柯基。

更多效果:

除了從文本生成圖像,GLIDE 還有圖像編輯功能。
根據(jù)文字描述,修改圖像。

總之,很強(qiáng)!
這個(gè)和我上個(gè)月發(fā)的多模態(tài) NüWA(女媧)算法功能類似。
不過(guò) NüWA 至今還沒(méi)有開(kāi)源,我被啪啪打臉了。
OpenAI 的 GLIDE 不存在這個(gè)問(wèn)題,直接開(kāi)源。

也是新鮮熱乎的。
項(xiàng)目地址:
https://github.com/openai/glide-text2im
更良心的是,還給大家配置了 colab。

不用配置環(huán)境,能登陸使用 google 的,可以直接運(yùn)行看效果。
三、JoJoGAN
JoJo 沒(méi)錯(cuò),就是這個(gè)。

JoJoGAN 就是將讓人臉動(dòng)漫化。
我還腦補(bǔ)了下,鬼滅要是也都是 JoJo 的畫風(fēng),是不是得這樣。

有點(diǎn)辣眼睛,我們還是看算法效果吧。

輸入一副圖片,根據(jù)動(dòng)漫的畫風(fēng),生成對(duì)應(yīng)畫風(fēng)的漫畫人臉。
JoJoGAN 其他生成效果展示:

這效果你打幾分?

還是新鮮熱乎,剛剛開(kāi)源。
項(xiàng)目地址:
https://github.com/mchong6/JoJoGAN
這個(gè)工程也提供了 colab,除了這個(gè),還有 web 試玩地址:
https://huggingface.co/spaces/akhaliq/JoJoGAN
絮叨
三個(gè)算法,都是新鮮熱乎的,我看到的第一時(shí)間,就分享給各位小伙伴了。
今天,我連續(xù)寫了兩篇文章,一篇是大家已經(jīng)看完的這篇 AI 算法。
另一篇是預(yù)計(jì)下周二或周三發(fā),還需要再改改。是一篇量化交易策略的新教程,硬核教程類,之前的文章里立的 Flag。
另一個(gè)立的 Flag 的,保姆級(jí)教學(xué)視頻,還在做,慢工出細(xì)活,爭(zhēng)取一次給大家都講明白。
上午寫一篇文章,下午寫一篇文章,晚上接著做視頻。
雖然忙了點(diǎn),但一天過(guò)得很充實(shí)!
我是努力還 Flag 的 Jack,我們下期見(jiàn)!

推薦閱讀
?? ?清華這樣上?? ?我的小金庫(kù)????從高考到程序員的成長(zhǎng)之路
