叫板DALL·E 2,預訓練大模型做編碼器,谷歌把文字轉圖像模型卷上天

來源:機器之心 本文約3400字,建議閱讀8分鐘
本文介紹了來自谷歌的研究者也在OpenAI做出了探索,提出了一種文本到圖像的擴散模型 Imagen。
OpenAI:DALL?E 2 就是最好的。谷歌:看下我們 Imagen 生成的柴犬?











論文地址:
https://gweb-research-imagen.appspot.com/paper.pdf

項目地址:
https://github.com/lucidrains/DALLE2-pytorch
基本模型
超分辨率模型



編輯:王菁 校對:林亦霖
評論
圖片
表情
