首页 / AI工具 / OmniAvatar – 浙大联合阿里推出的音频驱动全身视频生成模型

AI工具

OmniAvatar – 浙大联合阿里推出的音频驱动全身视频生成模型

baidu09_com 2025-08-30 42 0

OmniAvatar是浙江大学和阿里巴巴集团共同推出的音频驱动全身模型。模型根据输入的音频和文本提示，生成自然、逼真的全身动画视频，人物动作与音频完美同步，表情丰富。模型基于像素级多级音频嵌入策略和LoRA训练方法，有效提升唇部同步精度和全身动作的自然度，支持人物与物体交互、背景控制和情绪控制等功能，广泛应用在播客、互动视频、虚拟场景等多种领域。

OmniAvatar – 浙大联合阿里推出的音频驱动全身视频生成模型第1张

（图片来源网络，侵删）

OmniAvatar – 浙大联合阿里推出的音频驱动全身视频生成模型第2张

（图片来源网络，侵删）

浙大联合国际商学院浙江浙大联合创新投资管理合伙企业(有限合伙)浙江大学zjuuiuc联合学院浙大联谊浙江大学国际联合商学院 imba项目浙大校友联合体浙江大学联合学院

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/14439.html

baidu09_com管理员

上一篇

如何使用Agentic RAG和LangGraph构建智能FAQ聊天机器人

下一篇

可令机油质量怎么样？可令机油是什么品牌

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部