Lumina-Image 2.0 是开源的高效统一模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在文本对齐能力上达到行业领先水平,能根据文本描述生成高质量、多风格的图像。模型支持多种推理求解器,如中点求解器、欧拉求解器和DPM求解器,生成速度较快。

Lumina-baidu09Image 2.0 – 上海 AI Lab 开源的统一图像生成模型  第1张
(图片来源网络,侵删)
Lumina-baidu09Image 2.0 – 上海 AI Lab 开源的统一图像生成模型  第2张
(图片来源网络,侵删)