首页 > m-audio fast track驱动

m-audio fast track驱动

baidu09_com

发布了文章 2个月前

MultiTalk – 音频驱动的多人对话视频生成框架

MultiTalk 是中山大学深圳校区、美团和香港科技大学联合推出的新型音频驱动多人对话视频生成框架。框架根据多声道音频输入、参考图像和文本提示，生成包含人物互动且口型与音频一致的视频。...
AI工具

0 39 0
baidu09_com

发布了文章 2个月前

MEMO – 音频驱动的生成肖像说话视频框架，保持身份一致性和表现力

MEMO（Memory-Guided EMOtionaware diffusion）是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架，用在生成具有身份一致性和表现力的说话视频。MEMO围绕两个核...
AI工具

0 32 0

没有更多内容

关灯返回顶部