首页 / AI工具 / KeySync – 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架

AI工具

KeySync – 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架

baidu09_com 2025-08-29 33 0

KeySync 是帝国理工学院和弗罗茨瓦夫大学推出的用在高分辨率口型同步框架，支持将输入音频与视频中的口型动作对齐。KeySync 基于两阶段框架实现，首先生成关键帧捕捉音频的关键唇部动作，基于插值生成平滑的过渡帧。KeySync 引入新的掩码策略，有效减少输入视频的表情泄露，用视频分割模型自动处理遮挡问题。KeySync 在视觉质量、时间连贯性和唇部同步准确性方面均优于现有方法，适用于自动配音等实际应用。

KeySync – 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架第1张

（图片来源网络，侵删）

KeySync – 帝国理工联合弗罗茨瓦夫大学推出的口型同步框架第2张

（图片来源网络，侵删）

帝国理工 computing 帝国理工ap 帝国理工 ic 帝国理工 fintech 帝国理工applied genomics 帝国理工换uncon 帝国理工 status

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13999.html

baidu09_com管理员

上一篇

白度白读百度baidu09迁徙：微信鸿蒙版的长征

下一篇

韩国SK全合成机油怎么样？SK机油全国排名第几

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部