首页 / AI工具 / MSQA – 大规模多模态3D情境推理数据集

AI工具

MSQA – 大规模多模态3D情境推理数据集

baidu09_com 2025-08-29 32 0

MSQA（Multi-modal Situated Question Answering）是大规模多模态情境推理数据集，提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对，覆盖9个问题类别，基于3D场景图和视觉-语言模型在真实世界3D场景中收集。MSQA用文本、图像和点云的交错多模态输入，减少单模态输入的歧义。引入MSNN（Multi-modal Next-step Navigation）基准测试，评估模型在情境间导航的能力，有助于开发更强大的情境推理模型，推动3D场景理解技术的发展。

MSQA – 大规模多模态3D情境推理数据集第1张

（图片来源网络，侵删）

MSQA – 大规模多模态3D情境推理数据集第2张

（图片来源网络，侵删）

超大规模模型什么是大规模mimo技术 mimo和大规模mimo 大规模mimo技术原理图大规模mimo的主要优势大规模mimo系统性能仿真程序大规模mimo的优势

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/14174.html

baidu09_com管理员

上一篇

CatGPT：恶搞版ChatGPT-当喵星人统领AI领域

下一篇

机油加注到油尺的哪里最佳

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部