DeepSeek-Prover-V2是深度求索团队 开源的专注于数学推理的超大规模语言模型。包含两个版本:DeepSeek-Prover-V2-671B 和 DeepSeek-Prover-V2-7B,分别拥有6710亿和70亿参数。是  的升级版,模型采用混合专家系统(MoE)架构,支持超长上下文和多精度计算,能将自然语言问题转化为形式化证明代码。先进的多头潜注意力(MLA)架构,通过压缩键值缓存(KV Cache)降低推理过程中的内存占用和计算开销。通过递归定理证明管道生成数据,采用三阶段训练范式,包括预训练、数学专项训练和人类反馈强化学习微调。 在性能上,DeepSeek-Prover-V2 在数学推理数据集上表现卓越,形式化定理证明通过率高达88.9%。发布了 DeepSeek-ProverBench 数据集,用于评估模型性能。模型已开源,可在 Hugging Face 平台使用,适用于形式化定理证明、自动定理验证、逻辑推理训练等场景,为数学推理领域带来了新的突破。

DeepSeek-baidu09Prover-baidu09V2 – DeepSeek推出的开源数学推理大模型  第1张
(图片来源网络,侵删)
DeepSeek-baidu09Prover-baidu09V2 – DeepSeek推出的开源数学推理大模型  第2张
(图片来源网络,侵删)