Coqui TTS基于深度學習的文本轉(zhuǎn)語音庫
Coqui TTS 是一個用于高級文本到語音生成的庫。它建立在最新研究的基礎上,旨在實現(xiàn)易于訓練、速度和質(zhì)量之間的最佳平衡。Coqui TTS 帶有預訓練模型、用于測量數(shù)據(jù)集質(zhì)量的工具,并且已經(jīng)在 20 多種語言中用于產(chǎn)品和研究項目。
特征:
- 用于 Text2Speech 任務的高性能深度學習模型
- 快速高效的模型訓練
- 終端和 Tensorboard 上的詳細訓練日志
- 支持多揚聲器 TTS
- 高效、靈活、輕量級但具有完整的 Trainer API
- 能夠?qū)?PyTorch 模型轉(zhuǎn)換為 Tensorflow 2.0 和 TFLite 以進行推理
- 已發(fā)布和可供閱讀的模型
- 在 dataset_analysis 下管理 Text2Speech 數(shù)據(jù)集的工具
- 用于使用和測試模型的實用程序
- 模塊化的代碼庫可以輕松實現(xiàn)新想法
安裝
從 PyPI 安裝是最簡單的選擇。
pip install TTS
默認情況下,這只會安裝 PyTorch,要安裝 tensorflow 依賴項,需要額外使用tf。
pip install TTS[tf]
如果您打算編碼或訓練模型,請克隆并在本地安裝它。
git clone https://github.com/coqui-ai/TTS pip install -e .[all,dev,notebooks,tf] # Select the relevant extras
如果您使用的是 Ubuntu (Debian),還可以運行以下命令進行安裝。
$ make system-deps # intended to be used on Ubuntu (Debian). Let us know if you have a diffent OS. $ make install
評論
圖片
表情
