最新,可控視頻生成:Hotshot-XL
shadow:今天體驗了下剛發(fā)布2天的開源項目:根據(jù)文本生成動圖的SDXL模型。
opus:
效果怎么樣?能不能替代runway?我們來看下測試效果:
Text-to-GIF

a camel smoking a cigarette

Ronald McDonald sitting at a vanity mirror putting on lipstick

drake licking his lips and staring through a window at a cupcake

官方還提供了一個在線版本:
只能通過text生成嗎?當(dāng)然不是,更有多功能請繼續(xù)往下看
↓
Text-to-GIF with personalized LORAs

Text-to-GIF with ControlNet

通過LORA和ControlNet的組合使用,視頻生成的可控性更高了。另外,我們可以看下不同尺寸的生成效果:

目前支持情況:
| Aspect Ratio | Size |
0.42 |
320 x 768 |
0.57 |
384 x 672 |
0.68 |
416 x 608 |
1.00 |
512 x 512 |
1.46 |
608 x 416 |
1.75 |
672 x 384 |
2.40 |
768 x 320 |
蠻好,視頻生成又有了新工具。(工具箱已更新)

項目名:Hotshot-XL
star: 159
fork: 5
一句話介紹:
Hotshot-XL是一個與Stable Diffusion XL一起使用的文本生成GIF的模型,可以與任何SDXL模型配合使用。
# 切換SDXL大模型
# 配合LORA使用
# 配合ControlNet 使用
社群入口

備注:視頻生成
評論
圖片
表情
