伦敦大学学院联合培养
-
发布了文章 2个月前
OpenR – 伦敦大学联合多所高校推出提升大模型推理能力的框架
OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合开源的全链条训练框架,旨在提升大型语言模型(LLM)的复杂推理能力。OpenR集成过程奖励模型(PRM)训练、强化学习、多...
没有更多内容
OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合开源的全链条训练框架,旨在提升大型语言模型(LLM)的复杂推理能力。OpenR集成过程奖励模型(PRM)训练、强化学习、多...
没有更多内容