ComfyGen是由NVIDIA和特拉维夫大学研究人员推出的一种文本到图像生成系统,基于大型语言模型(LLM)自动创建与用户文本提示相匹配的工作流,提升图像生成的质量。系统解决传统单体模型在生成图像时存在的限制,结合多个专业组件如微调基础模型、LoRAs、嵌入、超分辨率步骤等构建复杂的工作流。ComfyGen提出两种基于LLM的方法:一种是基于用户偏好数据的调优方法,另一种是无需训练、直接选择现有流程的方法。两种方法显示出比传统模型或通用工作流更高的图像质量。

ComfyGen – 英伟达联合特拉维夫推出的文本到图像生成系统  第1张
(图片来源网络,侵删)
ComfyGen – 英伟达联合特拉维夫推出的文本到图像生成系统  第2张
(图片来源网络,侵删)