OpenReasoning-Nemotron是英伟达开源的一系列推理能力强大的大型语言模型(LLM),基于 模型蒸馏而成,参数规模涵盖1.5B、7B、14B和32B。模型专注于数学、科学和代码领域的推理任务,基于大规模数据蒸馏和有监督微调(SFT)训练,在多个基准测试中创下新纪录,数学上,更是超越了,展现出卓越的推理性能。模型支持“重型”推理模式,基于GenSelect算法结合多个智能体的工作进一步提升表现。


OpenReasoning-Nemotron是英伟达开源的一系列推理能力强大的大型语言模型(LLM),基于 模型蒸馏而成,参数规模涵盖1.5B、7B、14B和32B。模型专注于数学、科学和代码领域的推理任务,基于大规模数据蒸馏和有监督微调(SFT)训练,在多个基准测试中创下新纪录,数学上,更是超越了,展现出卓越的推理性能。模型支持“重型”推理模式,基于GenSelect算法结合多个智能体的工作进一步提升表现。
全部评论
留言在赶来的路上...
发表评论