首页 / AI工具 / JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架

AI工具

JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架

baidu09_com 2025-08-29 33 0

JoyGen是京东科技和香港大学推出的，音频驱动的3D说话人脸框架，专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特征和面部深度图，驱动唇部运动的生成，用单步UNet架构进行高效的视频编辑。JoyGen在训练过程中用包含130小时中文视频的高质量数据集，在开源的HDTF数据集上验证其优越性能。实验结果表明，JoyGen在唇部与音频同步和视觉质量方面均达到行业领先水平，为说话人脸视频编辑领域提供了新的技术解决方案。

JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架第1张

（图片来源网络，侵删）

JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架第2张

（图片来源网络，侵删）

京东港货都是正品吗京东湾沚超级航空港口京东港壳怎么样东港京东店在哪京东全球港京东港讯智能专营店是正品吗京东港澳售专线物流查询

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13991.html

baidu09_com管理员

上一篇

边缘AI新突破：MemryX AI加速卡与RK3588打造高效多路物体检测方案

下一篇

广本紫桶机油使用感受，广本紫桶机油可以跑多久

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部