Loopy是字节跳动推出的音频驱动的模型,用户可以让一张静态照片动起来,照片中的人物根据给定的音频文件进行面部表情和头部动作的同步,生成逼真的动态视频。Loopy基于先进的扩散模型技术,无需额外的空间信号或条件,捕捉并学习长期运动信息,生成自然流畅的动作,适用于娱乐、教育等多种场景。

Loopy – 字节跳动推出的音频驱动的AI视频生成模型  第1张
(图片来源网络,侵删)
Loopy – 字节跳动推出的音频驱动的AI视频生成模型  第2张
(图片来源网络,侵删)