點擊 ▲ 三分設關注，和 10 萬設計師一起成長

三分設 x 騰訊ISUX

正文共：6557 字 23 圖預計閱讀時間：18 分鐘

一、背景

最近 AI 創(chuàng)作內容火爆網(wǎng)絡，讓我們看到AI在設計上充滿想象力的未來。關于 AI 在設計上應用的探索由來已久，從早幾年的智能廣告素材，智能 Logo 再到如今的 AIGC ，AI 的成長突飛猛進。本文嘗試梳理 AI 目前在設計領域應用的最新進展，展望設計行業(yè)在 AI 技術影響下可能發(fā)生的變革。

二、AI 與設計相關的最新技術

1、自動化內容生成（ AIGC ）

從文本-圖像、文本-視頻、文本- 3D 模型到智能字體、智能文本，AI 在各類內容的創(chuàng)造上已經(jīng)突飛猛進，強大到讓人驚嘆地步。

1.1 文本-圖像技術

近一兩年以來，各大平臺推出的AI繪畫工具，用戶只要通過簡單學習，輸入文本，進行關鍵詞調教，即可生產(chǎn)各種風格的畫作。關于文本-圖像的原理可粗略分為文本理解和圖像生成兩個部分，目前主流的 AI 繪畫工具，文本理解部分大多基于 CLIP 模型，圖像生成部分大多基于 Diffusion 模型。相較之前的技術，AI 在關鍵詞理解和生成畫作的多元性有了大幅提升。下邊簡要為大家介紹最受歡迎、效果也最出色的 4 款 AI 繪畫工具的特色，關于每種工具使用教程以及如何生成高質量作品，大家可以自行研究。

Disco Diffusion

Disco Diffusion 是發(fā)布于 Google Colab 平臺的一款開源免費的繪畫工具，可以在 Google Drive 直接運行，也可以部署到本地。Disco Diffusion 在生成圖前需要完成一些基本參數(shù)設置，好處是可以按定制方式生成圖片，缺點是交互不如其他幾個工具便捷，操作較為復雜，生成時間也比較長。Disco Diffusion 擅長抽象氛圍圖，色彩華麗豐富，但在人像生成上效果不太理想。

描述“ A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation. ”

圖片來源：@x1ao4 ，關鍵詞 ”ancient Chinese village“

Midjourney

Midjourney 是一款部署在 Discord 上的繪畫工具，需申請測試資格，在收到邀約郵件后，加入 Discord 頻道，即可通過關鍵詞輸入完成繪畫。它的優(yōu)點在于操作非常簡單，用戶僅需通過關鍵詞輸入即可完成作畫，不用設置其他參數(shù)。它支持在生成圖片后，在已生成圖片基礎上進行調整。初次加入會贈送免費體驗資格，額度用完以后就需要按月/年付費完成繪畫。

Midjourney 對關鍵詞理解出色，無論出圖速度和完整度都優(yōu)于 Disco Diffusion，而且它對各類藝術風格模仿較為出色，通過設定風格，可以有幫助 AI 更好理解你想要的畫作效果。

來自 Midjourney 的一組對知名藝術家風格模仿的畫作

最近發(fā)布的 V5 版本在細節(jié)上又提升一步，寫實效果堪比照片，同時支持更多風格選擇，也解決了之前 AI 手部表達錯亂問題。

DALL-E 2

Dall-E2 是由 OpenAI 實驗室發(fā)布的，目前也處于內測階段，可在官網(wǎng)上申請體驗，但開放體驗資格有限。注冊后首次會免費獲贈生成機會，額度用完后需要按次付費生成。它不僅操作簡單，而且可控性比較強，但目前圖片比例是固定 1:1 方圖。DALL-E2 可以根據(jù)描述生成一幅畫，如果對圖效果不滿意，可以針對該圖生成 3 張新的圖片。而且如果對圖片局部不滿意，它可以支持選擇不滿意部分，單獨設置關鍵詞后再生成。此外，它還可以根據(jù)描述對現(xiàn)有圖像進行編輯，以及按給定原圖生成同一風格的不同畫像。

按描述“一個宇航員+騎馬+超現(xiàn)實風格”生成的畫

按描述“選一個位置加一只火烈鳥”生成的畫

根據(jù)戴珍珠耳環(huán)的少女風格生成的畫

Stable Diffusion

Stable Diffusion 是開源免費的，使用起來相當親民。使用渠道多樣，可以在官網(wǎng)、 Google Colab 、本地部署等方式使用，官網(wǎng)會默認給你點數(shù)，生成圖消耗點數(shù)，消耗完成需要充值使用，但通過 Google Colab 或本地部署基本可以不受數(shù)量限制。它可控參數(shù)豐富，功能齊全，滿足各種個性化需求，因此使用范圍最廣。而且 Stable Diffusion 支持插件，很多第三方在源代碼基礎上進行了 2 次開發(fā)，比如有的團隊就發(fā)布程序，讓用戶可以使用自己提供的圖像訓練 Stable Diffusion ，形成個性化數(shù)據(jù)模型，生成帶有自己風格的圖像。Stable Diffusion 在抽象的氛圍感上可能不如 Disco 和 Midjourney 出色，但它的想象力和創(chuàng)作力非常豐富，風格多樣，人物寫實。

Stable Diffusion官網(wǎng)示例圖

AI 繪畫工具吸引了大量用戶進行嘗試，他們形成了各自的社區(qū)，彼此分享作品、交流創(chuàng)作過程。雖然很多時候AI畫作效果不錯，但目前仍有一些待解決問題：

1. 生成的結果會有一些隨機性，無法按照嚴格需求的方式生產(chǎn)；

2. 關鍵詞描述對最終效果影響較大，對關鍵詞的描述技巧需要慢慢摸索；

3. 如果對內容一致性要求比較高的話，需要對模型進行訓練，有一定的技術挑戰(zhàn)。

1.2 文本-3D模型技術

在 Text-Image 技術基礎上，各大科技巨頭都紛紛入局嘗試 Text-3D 技術，目前公開了研究論文和初步效果的技術主要有：Google 推出的 DreamFusion 、NVIDIA 的GET3D 、Meta 的 MAV3D ，還有 OpenAI 的 Point-E 。這項技術還處在初期發(fā)展階段，有很多不完善的地方，比如缺乏幾何細節(jié)、缺乏紋理，在合成過程智能使用神經(jīng)渲染器，3D 軟件沒法通用等問題。還有一個普遍的缺點，就是生成速度緩慢，生成單個 3D 模型的常常需要數(shù)個小時。而 OpenAI 推出的 Point-E 僅需幾秒到幾分鐘就能產(chǎn)出一個 3D 模型。英偉達的 AI 科學家 Jim Fan 在推特上表示，Point-E 的生成速度約能達到 DreamFusion 的600倍。

OpenAI生成的3D模型

DreamFusion可以在任意角度、任意光照條件、任意三維環(huán)境中基于給定的文本提示生成模型

1.3 文本-視頻技術

文本生成視頻技術也是建立在文本圖片技術基礎之上，它主要是通過文本圖像對和無文本視頻來學習，根據(jù)文本理解生成幾個關鍵幀。建立插幀模型，基于關鍵幀補充關鍵幀之間的圖片，提高視頻流暢度。最后再進行每幀分辨率的提升，提高整體的視頻質量。AI 在文本生成視頻的技術相對較新，Meta / Google 在去年 10 月分別官宣對應的視頻生成器 Make-a-video / Imagen Video ，目前只公開了研究論文和幾個官網(wǎng)示例，但得益于文本圖片質量的飛速提升，可以預期很快圖片視頻技術也將大幅提升能力。

Google Imagen Video生成“一個開車的熊貓”

雖然目前通過文本生成視頻技術只能生成簡單的變化或動作、無法生成基于文本描述的細節(jié)以及多場景復雜故事的視頻。但通過AI對視頻內容進行智能處理技術，已經(jīng)有很多讓人驚艷效果，這部分在本文第2章節(jié)詳細展開介紹。

1.4 智能字體

日本筑波大學開發(fā)了一套以人工智能為基礎的漢字字型設計系統(tǒng)，可以讓原本需要人工設計上萬字的流程，縮短為只要完成五個手工漢字的設計，AI 就可以自動生產(chǎn)超過 14,000 個相同字體的漢字。

該系統(tǒng)通過學習大量已有字體，再從這幾個手工設計的字體范例中提取特征，通過調整參數(shù)值輸出為新的字型。而且它使用的是矢量圖，可以將其輸出為字體文件，讓字體制作所需的時間大大縮短。

2、AI特效及內容處理

2.1 AI視頻特效

視頻風格化

在線視頻編輯網(wǎng)站 Runway 于最近發(fā)布了AI視頻處理工具 Gen-2 ，該工具針對視頻處理的能力很強大，不僅可以通過文本、文本+圖片、圖片生成視頻，還可以對視頻進行各種風格化處理，比如只需要把你想要疊加的風格用圖片或者文字疊加上去，可很快按要求生成風格化的視頻。

原視頻通過添加一張驅動圖像即可生成風格化視頻

智能CG角色替換

由《頭號玩家》主演 Tye Sheridan 創(chuàng)立公司推出的 Wonder Studio 是一個可以為上傳的 CG 模型自動制作動畫、HDR 打光、合并到真人場景的 AI 工具。

2.2 AI圖形特效

智能編輯

Adobe 最近發(fā)布了 AI 編輯工具 Firefly ，雖然目前可體驗功能僅有圖片生成、文字效果 2 項功能。但根據(jù)介紹來看它具有強大的圖片編輯能力，包含隨手涂鴉作畫、上傳草圖即可生成矢量字體文件、一鍵修改畫面場景、關鍵詞生成設計模板等等能力；

智能生成

NVIDIA Canvas 早于 Adobe 發(fā)布了自家的涂鴉出圖能力，幫助設計師加快概念圖創(chuàng)作探索，并騰出更多時間進行創(chuàng)意表達。用戶通過調色板繪制簡單的形狀和線條， AI 模型會在屏幕上實時呈現(xiàn)出與之相呼應的風景圖像。用戶可以通過切換材質來自定義圖像效果，Canvas 提供 9 種風格的可視化效果和 20 種不同材質，比如將雪地改為草地，圖像將呈現(xiàn)從冬日仙境變?yōu)闊釒焯玫囊曈X感受。

2.3 AI輔助UI設計

AI生成UI版式

近期已經(jīng)有團隊開始實踐在 AI 輔助下的 UI 設計。比如 Habitable 開發(fā)的 Figma 插件“ AI designer ”，在展示視頻里，它可以通過一段描述生成復雜的頁面。

AI生成內容素材

Microsoft Designer 是一款智能生成圖文內容的設計工具，搭載 Dall-E2 ，根據(jù)用戶輸入文字指令，可以為用戶自動生成設計素材，如社群貼圖、營銷 Banner 等高質量的排版。

3、塑造虛擬人

虛擬人是近年很火的領域，虛擬人應用前景廣闊，如虛擬偶像、助手、主持人等等，是未來虛擬世界最重要的存在之一。如何塑造虛擬人的人格化特征，實現(xiàn)虛擬人功能，背后都依托的是 AI 技術的加持。

在虛幻引擎最新發(fā)布會上，發(fā)布了 MetaHuman 新功能 Animator 。它可以讓你使用 iPhone 或立體頭戴式攝像機（ HMC ）在 MetaHuman 角色上以高保真動畫的形式重現(xiàn)任何面部表演。有了它，你就能捕捉到演員表演中的個性、真實感和保真度，將每個細節(jié)和微妙變化轉移到任意 MetaHuman 身上，在虛幻引擎中為他們注入生命力。

三、AI對設計的價值

1、助力設計師表達創(chuàng)意

設計師可以將 AI 工具應用在工作中，比如當需要探索視覺概念時，可以使用簡單的文本說明生成一些素材供創(chuàng)意師提供靈感和參考；還可以借助 AI 將已有素材嘗試其他不同風格元素，探索可能性；再有就是利用一些AI圖形處理工具，快速生成系列內容比較篩選。

比如，數(shù)碼藝術家 Karen X Cheng 和時尚雜志《 Cosmopolitan 》團隊一起創(chuàng)造了首個由 AI 生成的藝術封面。雖然渲染這張圖片只用了 20 秒，但團隊為了達到更滿意的效果，將大量時間投入到創(chuàng)意方向的討論和關鍵詞的挑選與組合上，他們嘗試輸入了數(shù)百次創(chuàng)意關鍵字組合進行調試，最終找到了想要的效果。

使用提示詞 “a strong female president astronaut warrior walking on the planet Mars, digital art synthwave.”生成的幾組圖像

使用提示詞 “wide-angle shot from below of a female astronaut with an athletic feminine body walking with swagger toward camera on Mars in an infinite universe, synthwave digital art.” 生成的最終封面效果，

2、提供更新穎的營銷方式

AI 如今也成為廣告營銷領域必不可少的工具，通過 AIGC 或 AI 內容編輯功能，來實現(xiàn)營銷內容的個性化、可互動性等特征，來強化產(chǎn)品吸引力，提升品牌形象。

亨氏AI番茄醬

番茄醬品牌亨氏 Heinz 去年借助 AI 自動生成圖像的話題制作了趣味性的廣告，向廣大消費者證明了人工智能更喜歡亨氏番茄醬的事實。廣告中，亨氏利用 Dall-E2 ，輸入“番茄醬”后，AI 自動生成了一款有亨氏經(jīng)典外型包裝的番茄醬。當繼續(xù)輸入“文藝復興番茄醬”、“印象派番茄醬”、“外太空番茄醬”等更復雜的文字指令時，生成的圖像結果無論在風格上如何變化，所呈現(xiàn)的番茄醬外型和 LOGO 位置都與亨氏番茄醬極為相似，這也印證了廣告中的那句話：“連 AI 都認為番茄醬就是亨氏”。同時，亨氏還邀請了世界各地的粉絲參與到用 AI 創(chuàng)作番茄醬的活動中，粉絲們通過輸入各種詞匯，生成怪異、有趣的番茄醬圖像，并發(fā)布到網(wǎng)絡，亨氏將其中較為出色的案例分享到了官方社交平臺，利用AI生成視覺效果的熱點，成功幫助品牌進行了推廣傳播。

QQ音樂MUSE AI具像化歌曲海報

AIGC 已經(jīng)遍布 QQ 音樂的各處細節(jié)中，從聽歌體驗、視覺呈現(xiàn)、社交分享等多個維度，做了不少有趣的創(chuàng)新嘗試。與以往的歌曲專輯封面播放不同， QQ 音樂新上線的 AI 播放器是國內音樂行業(yè)首個在 AIGC 領域運用的視覺嘗試，其原理是通過在AI工具輸入關鍵詞，讓 AI 算法組合各種元素，生成有創(chuàng)意的播放器風格?，F(xiàn)在，QQ 音樂已推出機械裝甲、雪山白、積木游戲、工業(yè)灰等 6 款供用戶選擇，據(jù)悉還將結合場景，有更多樣式可以期待。

3、擴展品牌語言

設計師可以尋找更具創(chuàng)造性的方式與 AI 合作，比如創(chuàng)作品牌語言。杰西卡·沃爾什 ( Jessica Walsh ) 使用 AI 為虛擬核能影響者 Isodope 創(chuàng)建品牌語言，將核能重新塑造為一種向善的力量。Isodope 是巴西模特伊莎貝爾·博梅克 ( Isabelle Boemeke ) 創(chuàng)建的在線角色，目標是利用 Isodope 超凡脫俗的形象和創(chuàng)意風格在 TikTok 上吸引人們的注意力，來改變人們對核能爭議的看法，倡導將核能作為解決氣候變化和能源緊缺的手段。

Isodope 的品牌元素和排版完全由 AI 打造，Walsh 團隊將創(chuàng)意想法通過 DALL-E ，創(chuàng)造出一種全息插畫風格的品牌語言，通過易于分解的視覺元素和前衛(wèi)的風格表達來緩解人們對核的恐懼，Walsh 說：“你必須推動這個工具并學習如何與它對話，才能產(chǎn)生更復雜、更有趣、感覺更原始的東西?！?nbsp; DALL·E 還幫助品牌創(chuàng)建了各色貼紙，以便于創(chuàng)建社交資產(chǎn)。借助 AI 使 Isodope 團隊圍繞核能概念擴展和創(chuàng)造更多的品牌元素。

4、打造全新的交互方式

依賴于 AI 支撐的虛擬人和 Chatgpt 能力，未來人們面向虛擬世界的交互模式將由原來的文本、圖片、視頻等內容升級為擬人化的互動方式。這將大大提升虛擬產(chǎn)品互動的友好性，同時提升用戶對虛擬產(chǎn)品的情感鏈接。

日本便利店巨頭羅森( Lawson )在東京開設首家配備虛擬店員的“ Green Lawson ”門店。接待顧客的為顯示屏上的虛擬店員，一項研究數(shù)據(jù)表明，它通過線上發(fā)放優(yōu)惠券領取率是 10% ，通過人發(fā)領取率為 70% ，而通過虛擬人發(fā)領取率為 57% ，可見未來這種交互方式在商業(yè)領域的廣闊前景。

四、總結

很多人看到 AI 的發(fā)展現(xiàn)狀，不免擔心 AI 未來會在很多方面取代設計師。事實上大可不必如此看待問題，AI 雖然在圖像生成、圖像編輯和插圖排版等方面有著讓人贊嘆的效果。但就目前來看，它的內容生成還存在很多問題。即時 AI 在將來內容生成上已經(jīng)爐火純青，在情感表達、創(chuàng)意等很多方面，AI 還需要人的調教和指導才能產(chǎn)生很好的價值。

得益于 AI 在設計領域的快速發(fā)展，人工智能勢必會大大簡化設計師的工作，提升設計師處理各種圖像的效率。設計師也不必將時間浪費在去除背景等費力、重復的任務上，并且將有機會以最少的努力探索更多創(chuàng)意。學習和研究AI在設計上最新的能力，將這種能力找到一個很好的契合點，應用在項目中，必將為為項目帶來不一樣的亮色。

—— END ——

我們相信設計師和創(chuàng)造者一樣是思想家

三分設

一個開放的設計師共創(chuàng)學習型社區(qū)

助力全球 1 億設計師成長

好書推薦

深度鏈接

歡迎添加 ?? 星標 · 獲取每天推薦知識分享

每天閱讀充電 · 養(yǎng)成終身學習

「資訊」「文章」「活動」「招聘」「課程」

共創(chuàng)計劃·成員招募

「合伙人計劃」

「翻閱計劃」

「分享行動」

「項目共創(chuàng)」

「新媒體聯(lián)盟」

??????

期待與更多優(yōu)秀產(chǎn)品設計師一起成長

掃碼進群

星球共創(chuàng)資料庫

全年住主力設友建立設計知識體系

「體系化知識研討」

「設計·管理書籍共讀」「線上職場討論」

「實戰(zhàn)項目共創(chuàng)」「大會活動交流」

分享設計/管理/職場/心得，定期直播，答疑解惑

↓↓↓點開『閱讀原文』，關注星球資料庫

當設計遇上AI

點擊 ▲ 三分設 關注，和 10 萬設計師一起成長