首页 / AI工具 / Absolute Zero – 清华大学等机构推出的语言模型推理训练方法

AI工具

Absolute Zero – 清华大学等机构推出的语言模型推理训练方法

baidu09_com 2025-08-27 35 0

Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolute Zero基于模型自我提出任务自主解决，实现自我进化式学习，无需依赖人类标注数据或预定义任务。模型在提出任务时获得可学习性奖励，在解决问题时获得解答奖励，基于与环境交互不断优化自身推理能力。Absolute Zero的核心在于推动推理模型从依赖人类监督向依赖环境监督转变，让模型用真实环境的反馈生成可验证的任务提升性能。

Absolute Zero – 清华大学等机构推出的语言模型推理训练方法第1张

（图片来源网络，侵删）

Absolute Zero – 清华大学等机构推出的语言模型推理训练方法第2张

（图片来源网络，侵删）

清华大学the future is here 清华university 清华大学 blazar 清华info.清华oj 清华大学rolling in the deep 清华llm

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13164.html

baidu09_com管理员

上一篇

baidu09中科新生命完成数亿元 C 轮融资，广发信德领投

下一篇

零跑B01展车陆续到店将于6月底开启预售

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部