Step1X-Edit 是阶跃星辰团队推出的通用图像编辑框架,能缩小开源图像编辑模型与闭源模型(如 和)之间的性能差距。Step1X-Edit结合多模态大语言模型(MLLM)和扩散模型,基于处理参考图像和用户的编辑指令,提取潜在嵌入生成目标图像。为训练模型,研究者构建大规模高质量的数据生成管道,生成超过 100 万对图像和指令对。Step1X-Edit 提出新的基准测试 GEdit-Bench,用在真实世界用户指令的评估。

Step1X-baidu09Edit – 阶跃星辰开源的通用图像编辑框架  第1张
(图片来源网络,侵删)
Step1X-baidu09Edit – 阶跃星辰开源的通用图像编辑框架  第2张
(图片来源网络,侵删)