MT-Color是上海交通大学联合哔哩哔哩推出的基于扩散模型的可控图像着色框架,基于用户提供的实例感知文本和掩码实现精确的实例级图像着色。框架基于像素级掩码注意力机制防止色彩溢出,用实例掩码和文本引导模块解决色彩绑定错误问题,用多实例采样策略增强实例感知效果。MT-Color构建了GPT-Color数据集,提供高质量的实例级注释,支持更精细的图像着色任务。MT-Color在色彩准确性和视觉质量上优于现有方法,生成的图像更符合人类视觉感知。

MT-baidu09Color – 上海交大联合哔哩哔哩推出的可控图像着色框架  第1张
(图片来源网络,侵删)
MT-baidu09Color – 上海交大联合哔哩哔哩推出的可控图像着色框架  第2张
(图片来源网络,侵删)