擴散模型從原理到實戰(zhàn) : 從原理
★AIGC的應(yīng)用領(lǐng)域日益廣泛,而在圖像生成領(lǐng)域,擴散模型則是AIGC技術(shù)的一個重要應(yīng)用。
★本書以擴散模型理論知識為切入點,由淺入深地介紹了擴散模型的相關(guān)知識,并以大量生動有趣的實戰(zhàn)案例幫助讀者理解擴散模型的相關(guān)細節(jié)。
★本書既適合所有對擴散模型感興趣的AI研究人員、相關(guān)科研人員以及在工作中有繪圖需求的從業(yè)人員閱讀,也可以作為計算機等相關(guān)專業(yè)學(xué)生的參考書。
◎內(nèi)容簡介:
全書共8章,詳細介紹了擴散模型的原理,以及擴散模型退化、采樣、DDIM反轉(zhuǎn)等重要概念與方法,此外還介紹了Stable Diffusion、ControlNet與音頻擴散模型等內(nèi)容。最后,附錄提供由擴散模型生成的高質(zhì)量圖像集以及Hugging Face社區(qū)的相關(guān)資源。
◎?qū)I(yè)書評:
本書系統(tǒng)地介紹了擴散模型的原理和相關(guān)細節(jié),同時書中豐富的實戰(zhàn)案例也將引領(lǐng)讀者快速上手擴散模型。對于任何想...
★AIGC的應(yīng)用領(lǐng)域日益廣泛,而在圖像生成領(lǐng)域,擴散模型則是AIGC技術(shù)的一個重要應(yīng)用。
★本書以擴散模型理論知識為切入點,由淺入深地介紹了擴散模型的相關(guān)知識,并以大量生動有趣的實戰(zhàn)案例幫助讀者理解擴散模型的相關(guān)細節(jié)。
★本書既適合所有對擴散模型感興趣的AI研究人員、相關(guān)科研人員以及在工作中有繪圖需求的從業(yè)人員閱讀,也可以作為計算機等相關(guān)專業(yè)學(xué)生的參考書。
◎內(nèi)容簡介:
全書共8章,詳細介紹了擴散模型的原理,以及擴散模型退化、采樣、DDIM反轉(zhuǎn)等重要概念與方法,此外還介紹了Stable Diffusion、ControlNet與音頻擴散模型等內(nèi)容。最后,附錄提供由擴散模型生成的高質(zhì)量圖像集以及Hugging Face社區(qū)的相關(guān)資源。
◎?qū)I(yè)書評:
本書系統(tǒng)地介紹了擴散模型的原理和相關(guān)細節(jié),同時書中豐富的實戰(zhàn)案例也將引領(lǐng)讀者快速上手擴散模型。對于任何想要學(xué)習(xí)和了解擴散模型的人來說,本書都是頗具價值的參考資料。
——周明,瀾舟科技創(chuàng)始人兼CEO,創(chuàng)新工場首席科學(xué)家,CCF副理事長
受非平衡熱力學(xué)的啟發(fā),擴散模型以良好的數(shù)學(xué)解釋性及可控的生成多樣性迅速成為AIGC領(lǐng)域一顆耀眼的新星。本書從“一滴墨水”開始,由淺入深,從理論到實踐“擴散”出了圖像、文本與音頻的AIGC藍圖,并為讀者保留了精華,去除了“噪聲”,還原出了知識體系最真實的“分布”。
——楊耀東,北京大學(xué)人工智能研究院研究員
人工智能擴散模型在近幾年取得了令人目不暇接的驚艷成果,可以有效解決視覺內(nèi)容生成的瓶頸問題。仔細閱讀本書,你既可以對擴散模型背后的原理有較為深刻的理解,也可以依此動手進行實踐,從而牢固掌握擴散模型,為進一步創(chuàng)新或深度應(yīng)用打下堅實基礎(chǔ)。本書值得推薦!
——鐘聲,聲網(wǎng)CTO
縱觀人類歷史,機遇永遠屬于搶先一步占據(jù)未來高度的人。我們每一個人都有必要去探究人工智能的奧秘,以便在即將到來的變革大潮中爭得一席之地。
——馬伯庸,作家
《擴散模型從原理到實戰(zhàn)》以Hugging Face的擴散模型(Diffusion Model)課程為基礎(chǔ),通過理論和實例相結(jié)合的方式,為讀者構(gòu)建了一個完整的學(xué)習(xí)框架。無論你是新手還是經(jīng)驗豐富的從業(yè)者,這本以實戰(zhàn)為導(dǎo)向的圖書都能夠幫助你更好地理解和應(yīng)用擴散模型。
——王鐵震,Hugging Face中國地區(qū)負責(zé)人,高級工程師
隨著Stable Diffusion和Midjourney的推出,文生圖形式的AI繪畫火爆異常,很多游戲的角色設(shè)計、網(wǎng)上店鋪的頁面設(shè)計都用到了AI繪畫工具。本書系統(tǒng)地梳理了AI繪畫背后的一系列原理細節(jié),且有代碼實戰(zhàn),我非常推薦大家閱讀本書!
——July,七月在線創(chuàng)始人,CEO
李忻瑋,碩士畢業(yè)于美國常春藤盟校之一的哥倫比亞大學(xué)數(shù)據(jù)科學(xué)專業(yè),現(xiàn)任聲網(wǎng)人工智能算法工程師;主要研究方向是生成式人工智能、計算機視覺、自然語言處理、提示工程等。
蘇步升,擴散模型算法工程師,AIGC創(chuàng)業(yè)者,Hugging Face中國社區(qū)本地化工作組成員。
徐浩然,畢業(yè)于中國海洋大學(xué)電子信息工程專業(yè),現(xiàn)任聲網(wǎng)音頻算法工程師,從事?lián)P聲器聲學(xué)設(shè)計、音頻增強算法、音頻質(zhì)量評估算法等研究工作。
余海銘,本科畢業(yè)于暨南大學(xué),碩士畢業(yè)于加州大學(xué)爾灣分校;先后在中國科學(xué)院深圳先進技術(shù)研究院、愛奇藝、美團等單位工作;主要研究方向是圖像識別、圖像生成、多模態(tài)及自動駕駛等領(lǐng)域。
