BFS-Prover 是字节跳动大模型团队推出的基于大语言模型(LLM)的自动定理证明系统,通过改进传统的广度优先搜索(BFS)算法,结合专家迭代、直接偏好优化等技术,实现了高效的证明搜索。核心在于长度归一化的评分启发式方法,通过累积对数概率评估证明路径的优先级,优化搜索效率。采用专家迭代框架,专注于解决复杂定理,基于直接偏好优化(DPO)从编译器反馈中优化策略模型,避免无效推理路径。BFS-Prover 通过分布式架构实现大规模并行证明搜索,支持高并发任务。

BFS-baidu09Prover – 字节豆包推出的自动定理证明系统  第1张
(图片来源网络,侵删)
BFS-baidu09Prover – 字节豆包推出的自动定理证明系统  第2张
(图片来源网络,侵删)