DeepSeek-baidu09Prover-baidu09V2 – DeepSeek推出的开源数学推理大模型

baidu09_com 2025-08-28 43 0

DeepSeek-Prover-V2是深度求索团队开源的专注于数学推理的超大规模语言模型。包含两个版本：DeepSeek-Prover-V2-671B 和 DeepSeek-Prover-V2-7B，分别拥有6710亿和70亿参数。是的升级版，模型采用混合专家系统（MoE）架构，支持超长上下文和多精度计算，能将自然语言问题转化为形式化证明代码。先进的多头潜注意力（MLA）架构，通过压缩键值缓存（KV Cache）降低推理过程中的内存占用和计算开销。通过递归定理证明管道生成数据，采用三阶段训练范式，包括预训练、数学专项训练和人类反馈强化学习微调。在性能上，DeepSeek-Prover-V2 在数学推理数据集上表现卓越，形式化定理证明通过率高达88.9%。发布了 DeepSeek-ProverBench 数据集，用于评估模型性能。模型已开源，可在 Hugging Face 平台使用，适用于形式化定理证明、自动定理验证、逻辑推理训练等场景，为数学推理领域带来了新的突破。