DimensionX是香港科技大学、清华大学和生数科技共同推出的框架,能从单张图片生成高逼真度的3D和4D场景,基于视频扩散技术实现对空间和时间维度的精确控制。框架基于ST-Director技术解耦空间和时间因素,支持独立或组合控制,生成具有动态变化的复杂场景。DimensionX包含轨迹感知机制和身份保持去噪策略,增强场景的一致性和真实感。

DimensionX – 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架  第1张
(图片来源网络,侵删)
DimensionX – 港科大、清华和生数科技共同推出的单图像生成复杂3D、4D场景框架  第2张
(图片来源网络,侵删)