SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基于核范数低秩稀疏训练方案避免过拟合,引入渐进式参数调整策略,优化模型性能。SaRA能提高模型的适应性和泛化能力,显著降低计算成本,只要修改一行代码即可实现,具有很高的实用价值。

SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法  第1张
(图片来源网络,侵删)
SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法  第2张
(图片来源网络,侵删)