科大联合培养
-
发布了文章 2个月前
YuE – 港科大联合 M-baidu09A-baidu09P 推出的开源AI音乐生成模型
YuE 是香港科技大学和 Multimodal Art Projection 团队联合开发的开源 AI 音乐生成模型。能将歌词转化为完整的歌曲,支持多种音乐风格,包括流行、金属、爵士、嘻哈等,并且支持英语、中文、日语和韩语等...
-
发布了文章 2个月前
PosterCraft – 港科大联合美团等推出的美学海报生成框架
PosterCraft是香港科技大学(广州)和美团等机构推出的用在生成高质量美学海报的统一框架。框架摒弃模块化设计流程和固定的预定义布局,支持模型自由探索连贯且视觉上引人入胜的构图。...
-
发布了文章 2个月前
AudioX – 港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。...
-
发布了文章 2个月前
ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架
ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制,如音频、表情等。核心架构包括并行 Mamba 结构,通过多个分支利用不同驱动信号分别控制面部区域,基于门控机制和掩码丢弃策略,实现灵...
没有更多内容









