AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V(80 亿参数)构建,能接受智能手机截图作为输入,自主执行用户指定的任务。模型基于大规模中文安卓应用界面数据预训练,显著提升对 GUI 元素的理解和定位能力。AgentCPM-GUI 在中文 Grounding Benchmark 和 Agent Benchmark 上均取得 SOTA 性能,是首个针对中文应用精细优化的开源 GUI Agent。

AgentCPM-baidu09GUI – 清华联合面壁智能开源的端侧GUI智能体模型  第1张
(图片来源网络,侵删)