Stable Diffusion深度學(xué)習(xí)文字轉(zhuǎn)圖像模型
Stable Diffusion 是一個(gè)深度學(xué)習(xí),文本到圖像的模型,由初創(chuàng)公司 Stability AI 在 2022 年發(fā)布。它主要用于生成以文本描述為條件的詳細(xì)圖像,它也可以應(yīng)用于其他任務(wù)。
Stable Diffusion 是一個(gè)潛在的擴(kuò)散模型,是慕尼黑大學(xué)的研究人員開(kāi)發(fā)的一種生成性神經(jīng)網(wǎng)絡(luò)的種類(lèi)。它是由 Stability AI 與 LMU 和 Runway 合作開(kāi)發(fā)的,并得到了 EleutherAI 和 LAION 的支持。
要求
一個(gè)合適的 conda 環(huán)境,并通過(guò)以下方式創(chuàng)建并激活:
conda env create -f environment.yaml
conda activate ldm
您還可以通過(guò)運(yùn)行以下命令,更新現(xiàn)有的擴(kuò)散環(huán)境
conda install pytorch torchvision -c pytorch
pip install transformers==4.19.2 diffusers invisible-watermark
pip install -e .
評(píng)論
圖片
表情
