Scenethesis 是 NVIDIA 推出的创新框架,用在从文本生成交互式 3D 场景。框架结合大型语言模型(LLM)和视觉感知技术,基于多阶段流程实现高效生成,用 LLM 进行粗略布局规划,基于视觉模块细化布局生成图像指导,用优化模块调整物体姿态确保物理合理性,基于判断模块验证场景的空间连贯性。Scenethesis 能生成多样化的室内外场景,具有高度的真实感和物理合理性,广泛应用在虚拟内容创作、仿真环境和具身智能研究等领域。

Scenethesis – 英伟达推出的交互式3D场景生成框架  第1张
(图片来源网络,侵删)
Scenethesis – 英伟达推出的交互式3D场景生成框架  第2张
(图片来源网络,侵删)