MegaTTS 3是字节跳动与浙江大学合作推出的零样本合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容、音色、韵律等属性分别建模,支持中文、英文及中英混合语音合成,具备超高音质的能力,几秒音频样本能模仿目标声音。支持口音强度控制等可控性功能。MegaTTS 3可应用于语音合成、语音编辑、跨语言语音合成等多个场景。

MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统  第1张
(图片来源网络,侵删)
MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统  第2张
(图片来源网络,侵删)