上海交大john hopcroft center
-
发布了文章 2个月前
libcom – 上海交大推出开源的图像合成问题解决工具
libcom 是一个由上海交通大学 (BCMI 实验室推出的图像合成工具箱。旨在解决前景和背景之间的不一致性问题,如外观、几何和语义上的不匹配,生成逼真的合成图像。...
-
发布了文章 2个月前
SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法
SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基于核范数低秩稀疏训练方案避免过拟合,引入渐进式参数调整策略,优化模型性...
-
发布了文章 2个月前
PC Agent – 上海交大联合 GAIR 推出的电脑智能体AI系统
PC Agent是上海交通大学和Generative AI Research Lab (GAIR 联合推出的先进AI系统。系统基于模拟人类认知过程,执行如组织研究材料、起草报告和创建演示文稿等复杂数字工作。PC Agent集...
-
发布了文章 2个月前
OmniAlign-baidu09V – 上海交大联合上海 AI Lab 等推出的高质量数据集
OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质量数据集。OmniAlign-V包含约20万个多模态训练样本...
-
发布了文章 2个月前
MT-baidu09Color – 上海交大联合哔哩哔哩推出的可控图像着色框架
MT-Color是上海交通大学联合哔哩哔哩推出的基于扩散模型的可控图像着色框架,基于用户提供的实例感知文本和掩码实现精确的实例级图像着色。框架基于像素级掩码注意力机制防止色彩溢出,用实例掩码和文本引导模块解决色彩绑定错误问题...
-
发布了文章 2个月前
EDTalk – 上海交大联合网易推出高效解耦的情感说话头像合成模型
EDTalk是上海交通大学联合网易研发的音频驱动唇部同步模型,能实现对嘴型、头部姿态和情感表情的独立操控。只需上传一张图片、一段音频和参考视频,就能驱动图片中的人物说话,支持自定义情感,如高兴、愤怒、悲伤等。...
没有更多内容












