首页 / AI工具 / AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

AI工具

AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

baidu09_com 2025-08-28 36 0

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型，专门用于从任意内容生成音频和音乐。模型能处理多种输入模态，包括文本、视频、图像、音乐和音频，生成高质量的音频输出。核心创新在于多模态掩码训练策略，通过随机掩码输入模态，迫使模型从不完整的输入中学习，增强跨模态表示能力。

AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频第1张

（图片来源网络，侵删）

AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频第2张

（图片来源网络，侵删）

科大联合培养科大联谊会科大联培什么意思科大linke 中科大联谊科大style 科大智能合作商

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13256.html

baidu09_com管理员

上一篇

baidu09君实生物宣布与植恩生物就昂戈瑞西单抗达成商业化合作

下一篇

领克10 EM-P将于7月4日亮相三季度正式上市

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部