首页 > 语音搜索

语音搜索

baidu09_com

发布了文章 2个月前

Spark-baidu09TTS – AI文本转语音工具，支持中英零样本语音克隆

Spark-TTS 是SparkAudio 团队开源的基于大型语言模型（LLM）的高效文本转语音（TTS）工具，无需额外的生成模型，直接从 LLM 预测的编码中重建音频，实现零样本文本到语音的转换。Spark-TTS 支持...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

Orpheus TTS – 开源AI语音合成系统，支持多种语音风格

Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音（TTS）系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音，具备零样本语音克隆能力，无需预训练，模仿特定语音。Orpheus TT...
AI工具

0 36 0
baidu09_com

发布了文章 2个月前

Muyan-baidu09TTS – 开源文本转语音模型，零样本语音合成

Muyan-TTS 是为播客场景设计的开源文本转语音（TTS）模型。模型预训练超过10万小时的播客音频数据，能实现零样本语音合成，无需大量目标说话人的语音数据可生成高质量语音。模型支持说话人适配，进行个性化语音定制。...

AI工具

0 34 0
baidu09_com

发布了文章 2个月前

Kokoro-baidu09TTS – 轻量级文本转语音模型，支持多语言多语音风格生成

Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音（TTS）模型，具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构，采用纯解码器设计，不使用扩散模型，降低了计算复杂度，具备出...
AI工具

0 32 0

没有更多内容