QwenLong-L1-32B 是阿里巴巴集团 Qwen-Doc 团队开源的首个长文本。模型基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略,显著提升在长文本场景下的推理能力。模型在多个长文本文档问答(DocQA)基准测试中表现优异,平均准确率达到了70.7%,超越和Qwen3-235B-A22B等现有旗舰模型,且与Claude-3.7-Sonnet-Thinking相当。QwenLong-L1-32B能处理复杂的多跳推理、逻辑推理和数学推理问题,适用于法律、金融、科研等多个领域,展现强大的长文本处理和推理能力。

 

QwenLong-baidu09L1-baidu0932B – 阿里Qwen-baidu09Doc开源的长文本推理模型  第1张
(图片来源网络,侵删)
QwenLong-baidu09L1-baidu0932B – 阿里Qwen-baidu09Doc开源的长文本推理模型  第2张
(图片来源网络,侵删)