2025_NIPS_LeanDojo: Theorem Proving with Retrieval-Augmented Language Models

张

张建站

2026/5/23 4:21:10

10分钟阅读

2025_NIPS_LeanDojo: Theorem Proving with Retrieval-Augmented Language Models

文章核心总结与创新点主要内容本文针对现有基于大语言模型（LLMs）的定理证明工具存在私有代码、数据封闭、计算成本高的问题，提出了开源工具包LeanDojo，包含数据提取、交互工具、基准数据集和检索增强型证明模型ReProver。LeanDojo可从证明助手Lean中提取细粒度数据（含前提标注），构建含98,734个定理的基准数据集，并提供可靠的程序化交互环境；ReProver通过检索数学库中的前提辅助定理证明，仅需单GPU训练一周，在多个数据集上表现优于无检索基线和GPT-4，还能生成Lean中缺失的证明。创新点开源工具链LeanDojo：首次实现对Lean的可靠数据提取（含前提定位）和程序化交互，将证明检查错误率从21.1%降至1.4%，支持Lean 3和Lean 4。检索增强证明模型ReProver：首个将检索融入LLM定理证明的模型，通过程序分析筛选可访问前提、构造难负例，解决前提选择瓶颈。挑战性基准数据集：设计“novel_premises”数据划分，要求模型泛化到训练中未见过的前提，避免依赖记忆完成证明。低资源高效训练：无需私有数据集和大规模预训练，单GPU一周即可完成训练，降低定理证明研究门槛。翻译部分（Markdown格式）Abstract大语言模型（LLMs）在使用Lean等证明助手进行形式化定理证明方面展现出潜力。然而，

SAP LeanIX: 从“手工台账”到“EA中枢“

在上一篇文章中，我们跟着PumpTech走完了一整圈——从体检、找堵点、数据验证，到画目标蓝图、排路线图。最后我们提炼了一套“五步法”和一个“三维评估矩阵”，算是把EA方法论从书本拽到了地上。但故事讲完后，有一个问题始终悬而…...

2026/5/23 4:17:06 阅读更多 →

《QGIS空间数据处理与高级制图》021：按属性字段融合要素

作者：翰墨之道，毕业于国际知名大学空间信息与计算机专业，获硕士学位，现任国内时空智能领域资深专家、CSDN知名技术博主。多年来深耕地理信息与时空智能核心技术研发，精通 QGIS、GrassGIS、OSG、OsgEarth、UE、Cesium、OpenLayers、Leaflet、MapBox 等主流工具与框架，兼具…...

2026/5/23 4:12:01 阅读更多 →

深入了解指针（3）

文章目录数组名的理解对arr[i]的理解一维数组传参的本质二级指针指针数组指针数组的用处总结这里是think的博客希望可以一起交流知识，一起think 今天我们来学习指针(3)吧一起来think吧数组名的理解 //测试环境:X86 #include <stdio.h> int main() { int a…...

2026/5/23 4:10:05 阅读更多 →

免费API宝藏库：开发者必备的Public APIs完全指南 [特殊字符]

免费API宝藏库：开发者必备的Public APIs完全指南 🚀 【免费下载链接】public-apis A collective list of free APIs 项目地址: https://gitcode.com/GitHub_Trending/pu/public-apis 还在为寻找可靠API而烦恼吗？Public APIs项目为你准…...

2026/5/22 16:40:59 阅读更多 →