UNO是字节跳动推出创新的框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下的一致性难题。UNO基于扩散变换器生成高一致性的多主体数据,采用渐进式跨模态对齐技术,分阶段训练模型,逐步提升生成效果。引入了通用旋转位置嵌入(UnoPE),支持多种分辨率和长宽比的图像生成。

UNO – 字节跳动推出的创新AI图像生成框架  第1张
(图片来源网络,侵删)
UNO – 字节跳动推出的创新AI图像生成框架  第2张
(图片来源网络,侵删)