首页 > 科大style

科大style

baidu09_com

发布了文章 2个月前

SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架

SyncAnimation是实时端到端的音频驱动框架，用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频同步的上半身姿态和面部表情，包括嘴唇动作，实现高精度和高同步性的动画效果。...
AI工具

0 34 0
baidu09_com

发布了文章 2个月前

AudioX – 港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型，专门用于从任意内容生成音频和音乐。模型能处理多种输入模态，包括文本、视频、图像、音乐和音频，生成高质量的音频输出。...
AI工具

0 37 0

没有更多内容

关灯返回顶部