ChatGPT 之后,再玩玩 Stable-Diffusion

前些天體驗(yàn)的 ChatGPT 主要用來(lái)進(jìn)行文本方面的處理,那么圖片生成有沒(méi)有這樣的 AI 工具 呢?答案是肯定的。
例如:和菜頭公眾號(hào)的題圖和文章中的插圖大多都是使用 Stable-Diffusion 的 AI 圖形生成工具創(chuàng)作的。順著 Stable-Diffusion 搜索了下相關(guān)資料,發(fā)現(xiàn) AI 創(chuàng)作圖片的工具也有不少:
- Disco Diffusion:是發(fā)布于 Google Colab 平臺(tái)的一款利用人工智能深度學(xué)習(xí)進(jìn)行數(shù)字藝術(shù)創(chuàng)作的工具,它是基于 MIT 許可協(xié)議的開(kāi)源工具,可以在 Google Drive 直接運(yùn)行,也可以部署到本地運(yùn)行;
- Midjourney:是 Disco Diffusion 的原作者 Somnai 的作品,對(duì) Disco Diffusion 進(jìn)行了改進(jìn),平均 1 分鐘能出圖;
- DALL-E 2:OpenAI 推出 DALL·E 2, DALL-E 2 實(shí)現(xiàn)了更高分辨率和更低延遲;
- Stable-Diffusion:由 http://stability.ai/?推出,在 2022 年 8 月 10 號(hào)開(kāi)源了,10 幾秒就能出圖,算是比較快的了。
本文就以 Stable-Diffusion 為例,談?wù)勎业氖褂皿w驗(yàn)。Stable-Diffusion 作為一個(gè)開(kāi)源工具,使用的方式有多種:
1、基于開(kāi)源的工具提供了實(shí)現(xiàn),比如官方提供的 https://beta.dreamstudio.ai/dream;,也可以使用 https://huggingface.co/spaces/camenduru/webui
2、本地部署;
3、調(diào)用 API 。
官網(wǎng)注冊(cè)賬號(hào)
打開(kāi)?https://beta.dreamstudio.ai/?,直接選擇使用 Google 賬號(hào)進(jìn)行注冊(cè),你也可以選擇自己的方式。

相比較 ChatGPT ,dreamstudio 的注冊(cè)要方便很多,注冊(cè)成功后登錄界面如下:

dreamstudio 是收費(fèi)的,成功注冊(cè)后會(huì)贈(zèng)送 100 個(gè) credits ,每次生成圖片,會(huì)消耗一些 credits,消耗的多少跟設(shè)置有關(guān),默認(rèn)設(shè)置會(huì)產(chǎn)生 4 張 512 * 512 的圖,消耗 0.8 個(gè) credits 。
配置信息如下:
- Widht:圖片寬度;
- Height:圖片高度;
- Cfg Scale:一個(gè)閾值,越高生成的圖片越接近你的描述,越低,AI 發(fā)揮空間越大,保持默認(rèn)就好;
- Steps:生成圖片用的步驟數(shù),越大生成越慢;
- Number of Images:一次生成的圖片數(shù)量,默認(rèn)為 4,也可以改為 1,改成 1 后,生成一次只要 0.2 credits。
在上圖中最下面的文本框中輸入提示文本,點(diǎn)擊 Dream 按鈕便可生成。
huggingface
直接在瀏覽器輸入:https://huggingface.co/spaces/camenduru/webui 便可使用,可以不用注冊(cè)登錄,缺點(diǎn)就是需要排隊(duì),相當(dāng)于就是多人在同時(shí)使用這個(gè)服務(wù),如果排隊(duì)的人較多,生成的時(shí)間會(huì)比較長(zhǎng)。

本地化部署
本地化部署對(duì)機(jī)器的配置要求比較高,內(nèi)存和顯存都不能太低。
在 GitHub 上有一個(gè)倉(cāng)庫(kù) https://github.com/AUTOMATIC1111/stable-diffusion-webui 介紹了 stable-diffusion 怎樣離線(xiàn)部署使用,提供了 Windows、Liunx、Mac 等多種方式。
如果你使用的是 Mac ,可以參考:https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Installation-on-Apple-Silicon
如果你使用的是 Windows ,覺(jué)得安裝步驟比較繁瑣,還有人做了一鍵安裝和啟動(dòng)的項(xiàng)目放在 Github 上,地址如下:
https://github.com/EmpireMediaScience/A1111-Web-UI-Installer
提示語(yǔ)
AI 生成圖片的關(guān)鍵在于提示語(yǔ),就像使用 ChatGPT ,一個(gè)好的問(wèn)題是關(guān)鍵。提示語(yǔ)不會(huì)寫(xiě)的話(huà)可以先參考,在下面網(wǎng)站中可以搜索相關(guān)的圖片,查看提示語(yǔ):
https://lexica.art/
https://www.krea.ai/
https://laion-aesthetic.datasette.io/laion-aesthetic-6pls/images
先多看看那些精美有創(chuàng)意的圖片都是什么樣的提示詞生成的,看多了,再?lài)L試自己去修改、調(diào)整。
相關(guān)閱讀
