WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实现不同方法的统一评估。WorldScore 评估生成世界的三个关键方面:可控性、质量和动态性。基准包含精心策划的数据集,涵盖3000个测试样本,包括静态和动态、室内和室外、逼真和风格化的多样化世界。

WorldScore 在多个方面与其他现有基准测试有所不同,以下是详细的对比:

WorldScore – 斯坦福大学推出的世界生成模型统一评估基准  第1张
(图片来源网络,侵删)
WorldScore – 斯坦福大学推出的世界生成模型统一评估基准  第2张
(图片来源网络,侵删)