about:blank快手
-
发布了文章 2个月前
Klear-baidu09Reasoner – 快手开源的推理模型
Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,核心创新是 GPPO算法,通过...
-
发布了文章 2个月前
KAT-baidu09V1 – 快手开源的自动思考模型
KAT-V1是快手开源的自动思考(AutoThink)大模型,包含40B和200B两个版本。模型融合思考与非思考能力,能根据问题难度自动切换思考模式。40B版本性能逼近DeepSeek-R1(6850亿参数),200B版本在...
没有更多内容




