首页 / AI工具 / VibeVoice – 微软推出的开源文本转语音模型

AI工具

VibeVoice – 微软推出的开源文本转语音模型

baidu09_com 2025-08-31 42 0

VibeVoice 是微软推出的新型文本到语音（TTS）模型，能生成富有表现力、长篇幅、多说话者的对话式音频，如播客。模型通过创新的连续语音标记化技术和下一代标记扩散框架，结合大型语言模型（LLM），实现高效处理长序列音频的能力，同时保持高保真度。VibeVoice 能合成长达90分钟的语音，支持多达4位不同说话者，突破传统TTS系统的限制，为自然对话和情感表达提供新的可能。

VibeVoice – 微软推出的开源文本转语音模型第1张

（图片来源网络，侵删）

VibeVoice – 微软推出的开源文本转语音模型第2张

（图片来源网络，侵删）

微软viva 微软viso 微软宣布 microsoft visiual 微软的v 微软vlsc 微软the initiative

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/15079.html

baidu09_com管理员

上一篇

博世：2016年ADAS销售额将达10亿欧元

下一篇

百度白读白度拜读baidu09《鬼话钟馗》 17173特权欢乐礼包

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部