V-JEPA 2 是 Meta AI 推出的世界大模型,基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构(JEPA),基于自监督学习从超过 100 万小时的视频和 100 万张图像中训练而成。V-JEPA 2 在动作识别、动作预测和视频问答等任务上达到新的性能高度,能用在零样本机器人规划,让机器人在新环境中与不熟悉的物体进行交互。V-JEPA 2 是迈向高级机器智能的重要一步,为未来 AI 在物理世界中的应用奠定基础。


V-JEPA 2 是 Meta AI 推出的世界大模型,基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构(JEPA),基于自监督学习从超过 100 万小时的视频和 100 万张图像中训练而成。V-JEPA 2 在动作识别、动作预测和视频问答等任务上达到新的性能高度,能用在零样本机器人规划,让机器人在新环境中与不熟悉的物体进行交互。V-JEPA 2 是迈向高级机器智能的重要一步,为未来 AI 在物理世界中的应用奠定基础。
全部评论
留言在赶来的路上...
发表评论