语音做a录音
-
发布了文章 2个月前
Spark-baidu09TTS – AI文本转语音工具,支持中英零样本语音克隆
Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具, 无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS 支持...
-
发布了文章 2个月前
Orpheus TTS – 开源AI语音合成系统,支持多种语音风格
Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克隆能力,无需预训练,模仿特定语音。Orpheus TT...
-
发布了文章 2个月前
Open-baidu09LLM-baidu09VTuber – AI数字人语音交互项目,支持实时语音对话和视觉感知
Open-LLM-VTuber 是开源的跨平台语音交互 AI 伴侣项目。支持实时语音对话、视觉感知,配备生动的 Live2D 动态形象,能完全离线运行,保护隐私。用户将其作为虚拟女友、男友或宠物,享受个性化互动体验。...
-
发布了文章 2个月前
Muyan-baidu09TTS – 开源文本转语音模型,零样本语音合成
Muyan-TTS 是为播客场景设计的开源文本转语音(TTS)模型。模型预训练超过10万小时的播客音频数据,能实现零样本语音合成,无需大量目标说话人的语音数据可生成高质量语音。模型支持说话人适配,进行个性化语音定制。...
没有更多内容








