TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传统的 2D 模型,能将详细的形状、配置和时间变化纳入预测中。TesserAct 的核心优势在于其时空一致性,支持新视角合成,显著提升了策略学习的性能。

TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变  第1张
(图片来源网络,侵删)
TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变  第2张
(图片来源网络,侵删)