首页 > k 快手

k 快手

baidu09_com

发布了文章 2个月前

Klear-baidu09Reasoner – 快手开源的推理模型

Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型，专注于提升数学和代码推理能力。模型通过长思维链监督微调（long CoT SFT）和强化学习（RL）训练，核心创新是 GPPO算法，通过...

AI工具

0 37 0

没有更多内容

关灯返回顶部