蚂蚁baas
-
发布了文章 2个月前
Ring-baidu09lite – 蚂蚁技术开源的轻量级推理模型
Ring-lite是蚂蚁技术AntTech团队推出的基于MoE架构的轻量级推理模型。模型用Ling-lite-1.5为基础,基于独创的C3PO强化学习训练方法,在多项推理Benchmark上达到SOTA效果,仅用2.75B激...
-
发布了文章 2个月前
AReaL-baidu09boba – 蚂蚁联合清华开源的强化学习训练框架
AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能轻松训练推理模型。...
没有更多内容





