什么是擴(kuò)散模型(Diffusion Models),為什么它們是圖像生成的一大進(jìn)步?
共 4989字,需瀏覽 10分鐘
·
2024-05-25 12:00
也許過去十年在計算機(jī)視覺和機(jī)器學(xué)習(xí)方面的突破是GANs(生成式對抗網(wǎng)絡(luò))的發(fā)明——這種方法引入了超越數(shù)據(jù)中已經(jīng)存在的內(nèi)容的可能性,是一個全新領(lǐng)域的敲門磚,現(xiàn)在稱為生成式建模。然而,在經(jīng)歷了一個蓬勃發(fā)展的階段后,GANs開始面臨平臺期,其中大多數(shù)方法都在努力解決對抗性方法面臨的一些瓶頸。這不是單個方法的問題,而是問題本身的對抗性。GANs的一些主要瓶頸是:
圖像生成缺乏多樣性
模式崩潰
多模態(tài)分布問題學(xué)習(xí)
訓(xùn)練時間過長
由于問題表述的對抗性,不容易訓(xùn)練
GitHub鏈接:https://github.com/azad-academy/stable-diffusion-model-tutorial
往期精彩回顧
交流群
歡迎加入機(jī)器學(xué)習(xí)愛好者微信群一起和同行交流,目前有機(jī)器學(xué)習(xí)交流群、博士群、博士申報交流、CV、NLP等微信群,請掃描下面的微信號加群,備注:”昵稱-學(xué)校/公司-研究方向“,例如:”張小明-浙大-CV“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~(也可以加入機(jī)器學(xué)習(xí)交流qq群772479961)
