PartCrafter 是先进的,能从单张RGB图像中生成多个语义明确且几何形态各异的3D网格。通过组合潜在空间表示每个3D部件,使用层次化注意力机制在部件内部和部件之间传递信息,确保生成的3D模型具有全局一致性。模型基于预训练的3D网格扩散变换器(DiT),继承了其权重、编码器和解码器,进一步提升了生成能力。能实现端到端的部件感知生成,支持从单个对象到复杂多对象场景的生成。实验表明,模型在生成可分解的3D网格方面超越了现有方法,在输入图像中不可直接观察到的部件也能准确生成。

(图片来源网络,侵删)

(图片来源网络,侵删)
全部评论
留言在赶来的路上...
发表评论