Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规模数据集,包含多达 18 万亿个 tokens,Qwen2.5 在自然语言理解、文本生成、编程能力、数学能力等方面都有显著提升。Qwen2.5 支持长文本处理,能生成长文本(超过 8K tokens),增强对系统提示的适应性,提升角色扮演和聊天机器人的背景设置能力。Qwen2.5 还支持多达 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文等。 和 是针对编程和数学问题的专门模型,在专业领域内展现了强大的性能。

Qwen2.5 模型在 MMLU-rudex 基准(考察通用知识)、MBPP 基准(考察代码能力)和 MATH 基准(考察数学能力)上的得分分别高达 86.8、88.2、83.1。

Qwen2.5 – 阿里通义千问团队最新开源的最强AI大模型  第1张
(图片来源网络,侵删)
Qwen2.5 – 阿里通义千问团队最新开源的最强AI大模型  第2张
(图片来源网络,侵删)