复旦orientation
-
发布了文章 2个月前
UniToken – 复旦联合美团等机构推出的统一视觉编码框架
UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像的高级语义和低级细节。...
-
发布了文章 2个月前
StableAnimator – 复旦联合微软等机构推出的端到端身份一致性视频扩散框架
StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学共同推出的端到端高质量身份保持视频扩散框架。StableAnimator能根据一张参考图像和一系列姿态,无需任何后处理工具,直接合成高保真度且保...
没有更多内容





