首页 / AI工具 / GTA – 上海AI Lab联合交大推出评估通用工具智能体的基准测试

AI工具

GTA – 上海AI Lab联合交大推出评估通用工具智能体的基准测试

baidu09_com 2025-08-29 38 0

GTA（a benchmark for General Tool Agents）是上海交通大学和上海AI实验室共同推出的基准测试，评估大型语言模型（LLMs）在真实世界场景中调用工具的能力。GTA基于提供真实的用户问题、真实部署的工具和多模态输入输出，建立一个全面、细粒度的评估框架，有效衡量LLMs在复杂场景下的工具使用能力。GTA包含229个人类设计的问题，覆盖感知、操作、逻辑和创造力等多个类别，要求模型推理合适的工具，规划操作步骤，解决现实世界中的复杂任务。

GTA – 上海AI Lab联合交大推出评估通用工具智能体的基准测试第1张

（图片来源网络，侵删）

GTA – 上海AI Lab联合交大推出评估通用工具智能体的基准测试第2张

（图片来源网络，侵删）

gta上海地图 gta上海半导体股票代码 gta上海滩 gta5上海mod gta线上海景房 gta5线上海滩宝藏位置 gta5线上海边在哪

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13792.html

baidu09_com管理员

上一篇

直击Computex2025：英特尔重磅发布新一代GPU，图形和AI性能跃升3.4倍

下一篇

杜卡迪XDiavel Nera上市售价29.6万元

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部