Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TARS 提供桌面客户端,展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力,成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段,仅支持 macOS。

Agent TARS – 字节跳动开源的多模态 AI 项目  第1张
(图片来源网络,侵删)
Agent TARS – 字节跳动开源的多模态 AI 项目  第2张
(图片来源网络,侵删)