MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是先进的技术,能在短时间内将单张图像转化为高保真度的3D场景。通过智能分割输入图像,识别出场景中的独立元素,再基于多实例扩散模型,结合注意力机制,生成360度的3D场景。具有强大的全局感知能力和细节表现力,能在40秒内完成生成,对不同风格的图像具有良好的泛化能力。

 

MIDI – AI 3D场景生成技术,能将单张图像转化为360度3D场景  第1张
(图片来源网络,侵删)
MIDI – AI 3D场景生成技术,能将单张图像转化为360度3D场景  第2张
(图片来源网络,侵删)