Leffa(Learning Flow Fields in Attention)是 Meta AI推出的用在可控人物图像生成框架,基于在注意力机制中引入流场学习,精确控制人物的外观和姿势。Leffa基于正则化损失函数,指导模型在训练时让目标查询聚焦于参考图像中的正确区域,减少细节失真,提升图像质量。Leffa不增加额外参数和推理成本,且适用于多种扩散模型,展现了良好的模型无关性和泛化能力。

Leffa – Meta 开源的图像生成框架,精确控制人物的外观和姿势  第1张
(图片来源网络,侵删)
Leffa – Meta 开源的图像生成框架,精确控制人物的外观和姿势  第2张
(图片来源网络,侵删)