训练模型的方法
-
发布了文章 2个月前
大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当
大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当 首个FP4精度的大模型训练框架来了,来自微软研究院!在相同超参数的设置下,可以达到与FP8以及BF16相当的训练效果。这意味着所需的存储和计算...
-
发布了文章 2个月前
RAGEN – 训练大模型推理 Agent 的开源强化学习框架
RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)框架,通过...
没有更多内容









