<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

AudioLDM2文本轉(zhuǎn)音頻/音樂生成

聯(lián)合創(chuàng)作 · 2023-09-26 00:08

AudioLDM2 支持文本到音頻（包括音樂）和文本到語音生成。目前支持：

添加文本轉(zhuǎn)語音 checkpoint
支持生成更長的音頻（>10s）
優(yōu)化模型的推理速度。
與 Diffusers 庫集成（參閱 Diffusers）

預(yù)訓(xùn)練模型

可以通過設(shè)置“model_name”來選擇模型 checkpoint：

# CUDA
audioldm2 --model_name "audioldm2-full" --device cuda -t "Musical constellations twinkling in the night sky, forming a cosmic melody."

# MPS
audioldm2 --model_name "audioldm2-full" --device mps -t "Musical constellations twinkling in the night sky, forming a cosmic melody."

有五個 checkpoint 可供選擇：

audioldm2-full（默認(rèn)）：使用 AudioLDM2 架構(gòu)生成音效和音樂。
audioldm_48k：該 checkpoint 可以生成高保真音效和音樂。
audioldm_16k_crossattn_t5 ： AudioLDM 1.0的改進(jìn)版本。
audioldm2-full-large-1150k：audioldm2-full 的更大版本。
audioldm2-music-665k：音樂生成。
audioldm2-speech-gigaspeech（TTS 的默認(rèn)值）：文本轉(zhuǎn)語音，在 GigaSpeech 數(shù)據(jù)集上進(jìn)行訓(xùn)練。
audioldm2-speech-ljspeech：文本轉(zhuǎn)語音，在 LJSpeech 數(shù)據(jù)集上進(jìn)行訓(xùn)練。

目前支持 3 種設(shè)備：

cpu
cuda
mps（注意，計算需要大約 20GB 的 RAM）

瀏覽 17

點(diǎn)贊

收藏

分享

舉報

評論

圖片

表情

AudioLDM2文本轉(zhuǎn)音頻/音樂生成

AudioLDM2?支持文本到音頻（包括音樂）和文本到語音生成。目前支持：添加文本轉(zhuǎn)語音checkpoint支持生成更長的音頻（>10s）優(yōu)化模型的推理速度。與Diffusers庫集成（參閱?D

Bark文本提示生成音頻模型

Bark 是由 Suno 創(chuàng)建的基于轉(zhuǎn)換器的文本到音頻模型。Bark 可以生成高度逼真的多語言語音以

Bark文本提示生成音頻模型

Bark是由Suno創(chuàng)建的基于轉(zhuǎn)換器的文本到音頻模型。Bark可以生成高度逼真的多語言語音以及其他音頻-包括音樂、背景噪音和簡單的音效。該模型還可以產(chǎn)生非語言交流，如大笑、嘆息和哭泣。為了支持研究社區(qū)

文本生成，文本數(shù)據(jù)增強(qiáng)怎么做？

機(jī)器學(xué)習(xí)AI算法工程

Processus文本生成工具

Processus 是一個靈活而且強(qiáng)大的文本生成工具。包含各種生成策略：生成 HTML、JSON 和

Texen文本生成工具

Texen是一種通用的文字生成工具。能夠生產(chǎn)幾乎任何種類的文本輸出。提供一個Ant的任務(wù)，Texen使用一個控制模板，以及一些可選的worker模板，用來控制和管理輸出。控制模板示例：#*file:C

Processus文本生成工具

Processus是一個靈活而且強(qiáng)大的文本生成工具。包含各種生成策略：生成HTML、JSON和其他遞歸文本數(shù)據(jù)結(jié)構(gòu)生成隨機(jī)的單詞、語句甚至是故事創(chuàng)建強(qiáng)密碼生成字符名稱和其他屬性對字符串進(jìn)行過濾從數(shù)據(jù)集

AnimateDiff 文本生成視頻

AnimateDiff 是一個能夠?qū)€性化的文本轉(zhuǎn)換為動態(tài)圖像或視頻（text to video）的擴(kuò)展模型，它可以將生成的靜態(tài)圖像與動態(tài)運(yùn)動結(jié)合起來，從而創(chuàng)建個性化的動畫圖像。 AnimateDiff 的主要特點(diǎn)是可以適用于大多數(shù)現(xiàn)有的...

Prompt之文本生成

Texen文本生成工具

Texen是一種通用的文字生成工具。能夠生產(chǎn)幾乎任何種類的文本輸出。提供一個Ant的任務(wù)， Texe

點(diǎn)贊

收藏

分享

舉報

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

免费看黄色日逼视频 | 日韩一区二区三区视频在线观看 | 黑人大鸡吧操美女大逼 | 欧美中文一区 | 爱情岛成人亚洲WWW论坛 |