OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Oute3-350M-DEV基础模型,拥有3.5亿参数。OuteTTS具备音频标记化、CTC强制对齐技术和结构化提示创建等创新音频处理方法,支持语音克隆功能,及用户创建自定义说话人的声音。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。

OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音  第1张
(图片来源网络,侵删)
OuteTTS – 开源的文本到语音合成项目,基于纯语言建模方法生成语音  第2张
(图片来源网络,侵删)