Qwen2.5-Max是阿里云推出的超大规模MoE(Mixture of Experts)模型,使用超过20万亿tokens的预训练数据。模型在多个基准测试中表现卓越,超越了DeepSeek V3、Llama-3.1-405B等领先模型。支持指令模型和基座模型,适用于知识问答、等多种场景。用户可以通过平台直接对话,或调用API集成使用。

Qwen2.5-baidu09Max – 阿里通义千问推出的MoE模型  第1张
(图片来源网络,侵删)
Qwen2.5-baidu09Max – 阿里通义千问推出的MoE模型  第2张
(图片来源网络,侵删)