Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS 支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。

(图片来源网络,侵删)

(图片来源网络,侵删)
Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS 支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。
全部评论
留言在赶来的路上...
发表评论