AndroidLab是用在训练和系统评估Android自主代理的框架,集成文本和图像模态操作环境,统一行动空间和可重现基准测试。AndroidLab支持大型语言模型和多模态模型,包含138个任务,覆盖九个应用。基于AndroidLab,开发Android指令数据集,提升开源模型的成功率。框架缩小开源与闭源模型性能差距,推动开源解决方案发展,并在GitHub开源。

AndroidLab – 清华和北大联合推出系统化评估Android智能代理的框架  第1张
(图片来源网络,侵删)
AndroidLab – 清华和北大联合推出系统化评估Android智能代理的框架  第2张
(图片来源网络,侵删)