科大联培什么意思
-
发布了文章 2个月前
AudioX – 港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。...
-
发布了文章 2个月前
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不同驱动信号分别控制面部区域,基于门控机制和掩码丢弃策略,实现灵...
没有更多内容





