當設計遇上AI
點擊 ▲ 三分設 關注,和 10 萬設計師一起成長
三分設 x 騰訊ISUX

一、背景
最近 AI 創(chuàng)作內容火爆網(wǎng)絡,讓我們看到AI在設計上充滿想象力的未來。關于 AI 在設計上應用的探索由來已久,從早幾年的智能廣告素材,智能 Logo 再到如今的 AIGC ,AI 的成長突飛猛進。本文嘗試梳理 AI 目前在設計領域應用的最新進展,展望設計行業(yè)在 AI 技術影響下可能發(fā)生的變革。
二、AI 與設計相關的最新技術
1、自動化內容生成( AIGC )
從文本-圖像、文本-視頻、文本- 3D 模型到智能字體、智能文本,AI 在各類內容的創(chuàng)造上已經(jīng)突飛猛進,強大到讓人驚嘆地步。
1.1 文本-圖像技術
近一兩年以來,各大平臺推出的AI繪畫工具,用戶只要通過簡單學習,輸入文本,進行關鍵詞調教,即可生產(chǎn)各種風格的畫作。關于文本-圖像的原理可粗略分為文本理解和圖像生成兩個部分,目前主流的 AI 繪畫工具,文本理解部分大多基于 CLIP 模型,圖像生成部分大多基于 Diffusion 模型。相較之前的技術,AI 在關鍵詞理解和生成畫作的多元性有了大幅提升。下邊簡要為大家介紹最受歡迎、效果也最出色的 4 款 AI 繪畫工具的特色,關于每種工具使用教程以及如何生成高質量作品,大家可以自行研究。
Disco Diffusion
Disco Diffusion 是發(fā)布于 Google Colab 平臺的一款開源免費的繪畫工具,可以在 Google Drive 直接運行,也可以部署到本地。Disco Diffusion 在生成圖前需要完成一些基本參數(shù)設置,好處是可以按定制方式生成圖片,缺點是交互不如其他幾個工具便捷,操作較為復雜,生成時間也比較長。Disco Diffusion 擅長抽象氛圍圖,色彩華麗豐富,但在人像生成上效果不太理想。

描述“ A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation. ”

圖片來源:@x1ao4 ,關鍵詞 ”ancient Chinese village“
Midjourney
Midjourney 是一款部署在 Discord 上的繪畫工具,需申請測試資格,在收到邀約郵件后,加入 Discord 頻道,即可通過關鍵詞輸入完成繪畫。它的優(yōu)點在于操作非常簡單,用戶僅需通過關鍵詞輸入即可完成作畫,不用設置其他參數(shù)。它支持在生成圖片后,在已生成圖片基礎上進行調整。初次加入會贈送免費體驗資格,額度用完以后就需要按月/年付費完成繪畫。
Midjourney 對關鍵詞理解出色,無論出圖速度和完整度都優(yōu)于 Disco Diffusion,而 且它對各類藝術風格模仿較為出色,通過設定風格,可以有幫助 AI 更好理解你想要的畫作效果。

來自 Midjourney 的一組對知名藝術家風格模仿的畫作
最近發(fā)布的 V5 版本在細節(jié)上又提升一步,寫實效果堪比照片,同時支持更多風格選擇,也解決了之前 AI 手部表達錯亂問題。

DALL-E 2
Dall-E2 是由 OpenAI 實驗室發(fā)布的,目前也處于內測階段,可在官網(wǎng)上申請體驗,但開放體驗資格有限。注冊后首次會免費獲贈生成機會,額度用完后需要按次付費生成。它不僅操作簡單,而且可控性比較強,但目前圖片比例是固定 1:1 方圖。DALL-E2 可以根據(jù)描述生成一幅畫,如果對圖效果不滿意,可以針對該圖生成 3 張新的圖片。而且如果對圖片局部不滿意,它可以支持選擇不滿意部分,單獨設置關鍵詞后再生成。此外,它還可以根據(jù)描述對現(xiàn)有圖像進行編輯,以及按給定原圖生成同一風格的不同畫像。

按描述“一個宇航員+騎馬+超現(xiàn)實風格”生成的畫

按描述“選一個位置加一只火烈鳥”生成的畫

根據(jù)戴珍珠耳環(huán)的少女風格生成的畫
Stable Diffusion
Stable Diffusion 是開源免費的,使用起來相當親民。使用渠道多樣,可以在官網(wǎng)、 Google Colab 、本地部署等方式使用,官網(wǎng)會默認給你點數(shù),生成圖消耗點數(shù),消耗完成需要充值使用,但通過 Google Colab 或本地部署基本可以不受數(shù)量限制。它可控參數(shù)豐富,功能齊全,滿足各種個性化需求,因此使用范圍最廣。而且 Stable Diffusion 支持插件,很多第三方在源代碼基礎上進行了 2 次開發(fā),比如有的團隊就發(fā)布程序,讓用戶可以使用自己提供的圖像訓練 Stable Diffusion ,形成個性化數(shù)據(jù)模型,生成帶有自己風格的圖像。Stable Diffusion 在抽象的氛圍感上可能不如 Disco 和 Midjourney 出色,但它的想象力和創(chuàng)作力非常豐富,風格多樣,人物寫實。


Stable Diffusion官網(wǎng)示例圖
AI 繪畫工具吸引了大量用戶進行嘗試,他們形成了各自的社區(qū),彼此分享作品、交流創(chuàng)作過程。雖然很多時候AI畫作效果不錯,但目前仍有一些待解決問題:
1. 生成的結果會有一些隨機性,無法按照嚴格需求的方式生產(chǎn);
2. 關鍵詞描述對最終效果影響較大,對關鍵詞的描述技巧需要慢慢摸索;
3. 如果對內容一致性要求比較高的話,需要對模型進行訓練,有一定的技術挑戰(zhàn)。
1.2 文本-3D模型技術
在 Text-Image 技術基礎上,各大科技巨頭都紛紛入局嘗試 Text-3D 技術,目前公開了研究論文和初步效果的技術主要有:Google 推出的 DreamFusion 、NVIDIA 的GET3D 、Meta 的 MAV3D ,還有 OpenAI 的 Point-E 。這項技術還處在初期發(fā)展階段,有很多不完善的地方,比如缺乏幾何細節(jié)、缺乏紋理,在合成過程智能使用神經(jīng)渲染器,3D 軟件沒法通用等問題。還有一個普遍的缺點,就是生成速度緩慢,生成單個 3D 模型的常常需要數(shù)個小時。而 OpenAI 推出的 Point-E 僅需幾秒到幾分鐘就能產(chǎn)出一個 3D 模型。英偉達的 AI 科學家 Jim Fan 在推特上表示,Point-E 的生成速度約能達到 DreamFusion 的600倍。

OpenAI生成的3D模型
DreamFusion可以在任意角度、任意光照條件、任意三維環(huán)境中基于給定的文本提示生成模型
1.3 文本-視頻技術
文本生成視頻技術也是建立在文本圖片技術基礎之上,它主要是通過文本圖像對和無文本視頻來學習,根據(jù)文本理解生成幾個關鍵幀。建立插幀模型,基于關鍵幀補充關鍵幀之間的圖片,提高視頻流暢度。最后再進行每幀分辨率的提升,提高整體的視頻質量。AI 在文本生成視頻的技術相對較新,Meta / Google 在去年 10 月分別官宣對應的視頻生成器 Make-a-video / Imagen Video ,目前只公開了研究論文和幾個官網(wǎng)示例,但得益于文本圖片質量的飛速提升,可以預期很快圖片視頻技術也將大幅提升能力。
Google Imagen Video生成“一個開車的熊貓”
雖然目前通過文本生成視頻技術只能生成簡單的變化或動作、無法生成基于文本描述的細節(jié)以及多場景復雜故事的視頻。但通過AI對視頻內容進行智能處理技術,已經(jīng)有很多讓人驚艷效果,這部分在本文第2章節(jié)詳細展開介紹。
1.4 智能字體
日本筑波大學開發(fā)了一套以人工智能為基礎的漢字字型設計系統(tǒng),可以讓原本需要人工設計上萬字的流程,縮短為只要完成五個手工漢字的設計,AI 就可以自動生產(chǎn)超過 14,000 個相同字體的漢字。
該系統(tǒng)通過學習大量已有字體,再從這幾個手工設計的字體范例中提取特征,通過調整參數(shù)值輸出為新的字型。而且它使用的是矢量圖,可以將其輸出為字體文件,讓字體制作所需的時間大大縮短。

2、AI特效及內容處理
視頻風格化
在線視頻編輯網(wǎng)站 Runway 于最近發(fā)布了AI視頻處理工具 Gen-2 ,該工具針對視頻處理的能力很強大,不僅可以通過文本、文本+圖片、圖片生成視頻,還可以對視頻進行各種風格化處理,比如只需要把你想要疊加的風格用圖片或者文字疊加上去,可很快按要求生成風格化的視頻。

原視頻通過添加一張驅動圖像即可生成風格化視頻
智能CG角色替換
由《頭號玩家》主演 Tye Sheridan 創(chuàng)立公司推出的 Wonder Studio 是一個可以為上傳的 CG 模型自動制作動畫、HDR 打光、合并到真人場景的 AI 工具。
2.2 AI圖形特效
Adobe 最近發(fā)布了 AI 編輯工具 Firefly ,雖然目前可體驗功能僅有圖片生成、文字效果 2 項功能。但根據(jù)介紹來看它具有強大的圖片編輯能力,包含隨手涂鴉作畫、上傳草圖即可生成矢量字體文件、一鍵修改畫面場景、關鍵詞生成設計模板等等能力;
智能生成
NVIDIA Canvas 早于 Adobe 發(fā)布了自家的涂鴉出圖能力,幫助設計師加快概念圖創(chuàng)作探索,并騰出更多時間進行創(chuàng)意表達。用戶通過調色板繪制簡單的形狀和線條, AI 模型會在屏幕上實時呈現(xiàn)出與之相呼應的風景圖像。用戶可以通過切換材質來自定義圖像效果,Canvas 提供 9 種風格的可視化效果和 20 種不同材質,比如將雪地改為草地,圖像將呈現(xiàn)從冬日仙境變?yōu)闊釒焯玫囊曈X感受。
2.3 AI輔助UI設計
AI生成UI版式
近期已經(jīng)有團隊開始實踐在 AI 輔助下的 UI 設計。比如 Habitable 開發(fā)的 Figma 插件“ AI designer ”,在展示視頻里,它可以通過一段描述生成復雜的頁面。

AI生成內容素材
Microsoft Designer 是一款智能生成圖文內容的設計工具,搭載 Dall-E2 ,根據(jù)用戶輸入文字指令,可以為用戶自動生成設計素材,如社群貼圖、營銷 Banner 等高質量的排版。
3、塑造虛擬人
在虛幻引擎最新發(fā)布會上,發(fā)布了 MetaHuman 新功能 Animator 。它可以讓你使用 iPhone 或立體頭戴式攝像機( HMC )在 MetaHuman 角色上以高保真動畫的形式重現(xiàn)任何面部表演。有了它,你就能捕捉到演員表演中的個性、真實感和保真度,將每個細節(jié)和微妙變化轉移到任意 MetaHuman 身上,在虛幻引擎中為他們注入生命力。
三、AI對設計的價值
1、助力設計師表達創(chuàng)意

使用提示詞 “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”生成的幾組圖像

使用提示詞 “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art.” 生成的最終封面效果,
2、提供更新穎的營銷方式
AI 如今也成為廣告營銷領域必不可少的工具,通過 AIGC 或 AI 內容編輯功能,來實現(xiàn)營銷內容的個性化、可互動性等特征,來強化產(chǎn)品吸引力,提升品牌形象。
亨氏AI番茄醬
番茄醬品牌亨氏 Heinz 去年借助 AI 自動生成圖像的話題制作了趣味性的廣告,向廣大消費者證明了人工智能更喜歡亨氏番茄醬的事實。廣告中,亨氏利用 Dall-E2 ,輸入“番茄醬”后,AI 自動生成了一款有亨氏經(jīng)典外型包裝的番茄醬。當繼續(xù)輸入“文藝復興番茄醬”、“印象派番茄醬”、“外太空番茄醬”等更復雜的文字指令時,生成的圖像結果無論在風格上如何變化,所呈現(xiàn)的番茄醬外型和 LOGO 位置都與亨氏番茄醬極為相似,這也印證了廣告中的那句話:“連 AI 都認為番茄醬就是亨氏”。同時,亨氏還邀請了世界各地的粉絲參與到用 AI 創(chuàng)作番茄醬的活動中,粉絲們通過輸入各種詞匯,生成怪異、有趣的番茄醬圖像,并發(fā)布到網(wǎng)絡,亨氏將其中較為出色的案例分享到了官方社交平臺,利用AI生成視覺效果的熱點,成功幫助品牌進行了推廣傳播。

QQ音樂MUSE AI具像化歌曲海報
AIGC 已經(jīng)遍布 QQ 音樂的各處細節(jié)中,從聽歌體驗、視覺呈現(xiàn)、社交分享等多個維度,做了不少有趣的創(chuàng)新嘗試。與以往的歌曲專輯封面播放不同, QQ 音樂新上線的 AI 播放器是國內音樂行業(yè)首個在 AIGC 領域運用的視覺嘗試,其原理是通過在AI工具輸入關鍵詞,讓 AI 算法組合各種元素,生成有創(chuàng)意的播放器風格?,F(xiàn)在,QQ 音樂已推出機械裝甲、雪山白、積木游戲、工業(yè)灰等 6 款供用戶選擇,據(jù)悉還將結合場景,有更多樣式可以期待。
3、擴展品牌語言
Isodope 的品牌元素和排版完全由 AI 打造,Walsh 團隊將創(chuàng)意想法通過 DALL-E , 創(chuàng)造出一種全息插畫風格的品牌語言,通過易于分解的視覺元素和前衛(wèi)的風格表達來緩解人們對核的恐懼,Walsh 說:“你必須推動這個工具并學習如何與它對話,才能產(chǎn)生更復雜、更有趣、感覺更原始的東西?!?nbsp; DALL·E 還幫助品牌創(chuàng)建了各色貼紙,以便于創(chuàng)建社交資產(chǎn)。借助 AI 使 Isodope 團隊圍繞核能概念擴展和創(chuàng)造更多的品牌元素。

4、打造全新的交互方式
依賴于 AI 支撐的虛擬人和 Chatgpt 能力,未來人們面向虛擬世界的交互模式將由原來的文本、圖片、視頻等內容升級為擬人化的互動方式。這將大大提升虛擬產(chǎn)品互動的友好性,同時提升用戶對虛擬產(chǎn)品的情感鏈接。
日本便利店巨頭羅森( Lawson )在東京開設首家配備虛擬店員的“ Green Lawson ”門店。接待顧客的為顯示屏上的虛擬店員,一項研究數(shù)據(jù)表明,它通過線上發(fā)放優(yōu)惠券領取率是 10% ,通過人發(fā)領取率為 70% ,而通過虛擬人發(fā)領取率為 57% ,可見未來這種交互方式在商業(yè)領域的廣闊前景。

四、總結
得益于 AI 在設計領域的快速發(fā)展,人工智能勢必會大大簡化設計師的工作,提升設計師處理各種圖像的效率。設計師也不必將時間浪費在去除背景等費力、重復的任務上,并且將有機會以最少的努力探索更多創(chuàng)意。學習和研究AI在設計上最新的能力,將這種能力找到一個很好的契合點,應用在項目中,必將為為項目帶來不一樣的亮色。
