Seed-TTS是由字节跳动开发的高级(Text to Speech,TTS)模型,能够生成与人类语音极为相似的高质量语音,具备出色的上下文学习能力和自然度。Seed-TTS支持对情感、语调、说话风格等语音属性的精细控制,适用于有声读物、视频配音等多种场景。此外,该模型还具备零样本学习能力,即使在没有训练数据的情况下也能生成高质量语音,并且支持内容编辑和多语种翻译功能。

Seed-TTS目前只提供了技术论文和官方Demo,暂未开放使用地址,感兴趣的用户可以前往官网查看官方演示。

Seed-baidu09TTS – 字节跳动推出的高质量文本到语音生成模型  第1张
(图片来源网络,侵删)
Seed-baidu09TTS – 字节跳动推出的高质量文本到语音生成模型  第2张
(图片来源网络,侵删)