Fin-R1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.5-7B-Instruct架构,通过在金融推理场景的高质量思维链数据上进行SFT和RL两阶段训练,有效提升金融复杂推理能力。在权威评测中,Fin-R1平均得分75.2分,与行业标杆仅差3分,位居榜单第二。数据构建融合了多个金融领域的高质量数据集,通过数据蒸馏构建了约60k条高质量COT数据集。

Fin-baidu09R1 – 上海财经联合财跃星辰推出的金融推理大模型  第1张
(图片来源网络,侵删)
Fin-baidu09R1 – 上海财经联合财跃星辰推出的金融推理大模型  第2张
(图片来源网络,侵删)