deep smoker
-
发布了文章 2个月前
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法 RTX 3080 移动版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。自 DeepSeek-R1 发布以来...
-
发布了文章 2个月前
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文 本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点,读完会对 GRPO 及其改进...
-
发布了文章 2个月前
DeepSeek在昇腾上的模型部署的常见问题及解决方案
2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见问题困扰着不少开发者。 本文将为你详细阐...
没有更多内容














