Parler TTS介绍
Parler TTS是一个轻量级在线文本转语音工具,AI训练和推理库高保真文本转语音 (TTS) 模型,可以生成高质量、自然流畅的语音,具有可以使用简单文本提示控制的功能(例如性别、背景噪音、语速、音调和混响)。
完全开源的发布版本,开源地址:https://github.com/huggingface/parler-tts
Parler TTS特点
包括术语“非常清晰的音频”以生成最高质量的音频,包括“非常嘈杂的音频”以生成高水平的背景噪音
标点符号可用于控制世代的韵律,例如使用逗号在语音中添加小中断
其余的语音功能(性别、语速、音调和混响)可以通过提示直接控制