微软研究院总部
-
发布了文章 2个月前
MineWorld – 微软研究院开源的实时交互式世界模型
MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉-动作自回归Transformer架构,将游戏场景和动作转化为离散的token ID,通过下一个token预测进行训练。...
-
发布了文章 2个月前
Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型
Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解和执行多模态输入的任务,覆盖数字和物理环境。Magma基于大规模的视觉-语言数据和动作数据进行预...
没有更多内容





