ArtCrafter是清华大学、鹏城实验室和联想研究院共同推出的文本到图像风格迁移框架,基于扩散模型,解决传统方法在风格表达、内容一致性和输出多样性方面的局限。ArtCrafter基于嵌入重构架构实现,包含三个关键组件:基于注意力的风格提取模块,用多层架构和感知器注意力机制从参考图像中提取细腻的风格特征;文本-图像对齐增强模块,基于注意力交互将图像和文本嵌入映射到共享特征空间,使生成图像更贴近文本提示内容;显式调制组件,基于线性插值和拼接融合原始与多模态嵌入,生成多样化且与文本相关的图像。

ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架  第1张
(图片来源网络,侵删)
ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架  第2张
(图片来源网络,侵删)