科大style
-
发布了文章 2个月前
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架
SyncAnimation是实时端到端的音频驱动框架,用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频同步的上半身姿态和面部表情,包括嘴唇动作,实现高精度和高同步性的动画效果。...
-
发布了文章 2个月前
AudioX – 港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。...
没有更多内容





