中科大联谊
-
发布了文章 2个月前
WeGen – 中科大联合上海交大等推出的统一多模态生成模型
WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。WeGen结合多模态大语言模型(MLLM)和扩散模型,处理文本到图像生成、条件驱动生成...
-
发布了文章 2个月前
AudioX – 港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐和音频,生成高质量的音频输出。...
没有更多内容




