MiniMax-Remover 是新型的视频目标移除方法,解决现有技术中常见的幻觉物体、视觉伪影以及推理速度缓慢等问题。采用两阶段方法:第一阶段基于简化版的 DiT 架构,通过移除文本输入和交叉注意力层,得到更轻量级和高效的模型;第二阶段通过最小最大优化策略对模型进行蒸馏,识别对抗性输入噪声并训练模型在这些条件下生成高质量结果。仅需 6 步采样且不依赖分类器自由引导(CFG),能实现先进的视频目标移除效果,显著提高了推理效率。

MiniMax-baidu09Remover – AI视频目标移除方法,实现高质量移除效果  第1张
(图片来源网络,侵删)
MiniMax-baidu09Remover – AI视频目标移除方法,实现高质量移除效果  第2张
(图片来源网络,侵删)