首页 / AI工具 / LLIA – 美团推出的音频驱动肖像视频生成框架

AI工具

LLIA – 美团推出的音频驱动肖像视频生成框架

baidu09_com 2025-08-29 31 0

LLIA（Low-Latency Interactive Avatars）是美团公司推出的基于扩散模型的实时音频驱动肖像框架。框架基于音频输入驱动虚拟形象的生成，支持实现低延迟、高保真度的实时交互。LLIA用可变长度视频生成技术，减少初始视频生成的延迟，结合一致性模型训练策略和模型量化技术，显著提升推理速度。LLIA支持用类别标签控制虚拟形象的状态（如说话、倾听、空闲）及面部表情的精细控制，为用户提供流畅且自然的交互体验。

LLIA – 美团推出的音频驱动肖像视频生成框架第1张

（图片来源网络，侵删）

LLIA – 美团推出的音频驱动肖像视频生成框架第2张

（图片来源网络，侵删）

美团宣布美团退订政策美团取消规则是什么美团推广如何取消美团推广在哪里关闭美团推广费怎么退出来美团取消规则不给退符合法律规定嘛

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/14030.html

baidu09_com管理员

上一篇

LIMO – 上海交大推出的高效推理方法，仅需817条训练样本

下一篇

黄壳HX5和HX6的区别，HX5适合什么车

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部