TrackVLA是银河通用推出的产品级端到端导航大模型。模型具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力,能实现从视觉感知到动作输出的全链路闭环。无需提前建图,在复杂环境中自主导航、灵活避障,根据自然语言指令识别和跟踪目标对象。TrackVLA让机器人在真实场景中展现出强大的自主性和智能交互能力,为具身智能的商业化落地提供重要支撑,推动机器人从实验室走向日常生活,成为人类的智能伙伴。

TrackVLA – 银河通用推出的纯视觉端到端导航大模型  第1张
(图片来源网络,侵删)
TrackVLA – 银河通用推出的纯视觉端到端导航大模型  第2张
(图片来源网络,侵删)