Gemini Robotics On-Device是谷歌DeepMind推出的首个可在机器人本地运行的视觉-语言-动作(VLA)模型。模型具备强大的离线操作能力,能遵循自然语言指令完成精细任务,如拉开袋子、叠衣服等。模型支持多种机器人本体部署,响应延迟低,适合对延迟敏感的应用。Gemini Robotics On-Device具备快速适应新任务的能力,仅需50到100个演示样本即可学会新动作,展现出强大的泛化性能。谷歌推出Gemini Robotics SDK,助力开发者评估和部署模型,降低开发成本和风险。

Gemini Robotics On-baidu09Device – 谷歌推出的首个本地具身智能模型  第1张
(图片来源网络,侵删)
Gemini Robotics On-baidu09Device – 谷歌推出的首个本地具身智能模型  第2张
(图片来源网络,侵删)