首页 > deep pro

deep pro

baidu09_com

发布了文章 2个月前

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法 RTX 3080 移动版能训练哪种大模型？本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。自 DeepSeek-R1 发布以来...
AI人工智能

0 41 0
baidu09_com

发布了文章 2个月前

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文

DeepSeek用的GRPO有那么特别吗？万字长文分析四篇精品论文本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点，读完会对 GRPO 及其改进...
AI人工智能

0 38 0

没有更多内容

关灯返回顶部