首页 / AI工具 / DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架

AI工具

DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架

baidu09_com 2025-08-28 38 0

DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域，覆盖两大生成范式（diffusion 和 rectified flow）、三项任务（文本到图像、文本到视频、图像到视频）、四种基础模型（SD、HunyuanVideo、FLUX、SkyReels-I2V）及五类奖励模型（图像视频美学、图文对齐、视频动态质量、二元奖励）。DanceGRPO 解决现有视觉生成任务中 RLHF 方案的局限性，实现在多种生成范式、任务、基础模型和奖励模型之间的无缝适应，显著提升模型性能，降低显存压力，适应大型 prompt 数据集训练，能迁移到 rectified flow 和视频生成模型。

DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架第1张

（图片来源网络，侵删）

DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架第2张

（图片来源网络，侵删）

字节project v 字节vanessa 字节spotbonus byte dance 字节跳动字节sso 字节 all hands 字节zero

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13487.html

baidu09_com管理员

上一篇

小米公布AI通信专利

下一篇

小勇机器人荣获“2023中韩创新创业导师iCK30·30 M3O”榜单！

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部