验证了!前量化研究员 Neel Somani 利用 GPT-5.2 在15分钟内完成了对保罗·埃尔德什未解难题的完整证明。这一突破不仅通过了 Lean 形式化验证,更标志着 AI 从简单的计算工具正式迈向逻辑推理与知识创造的深水区。
AI 逻辑推理的里程碑式飞跃
数学界近期迎来了一场静悄悄却震耳欲聋的革命。作为衡量人类智慧皇冠上的明珠,保罗·埃尔德什(Paul Erdős)留下的数千个猜想一直被视为难以逾越的高峰。然而,Neel Somani 的实验打破了这一宁静:GPT-5.2 仅耗时 15 分钟的“思考时间”,便输出了一套严谨的证明方案。
这并非孤例。自去年圣诞节以来,相关数学挑战网站上已有 15 个长期悬而未决的问题被标记为“已解决”,其中 11 个解决方案明确标注有 AI 的深度参与。与以往 AI 仅作为辅助计算的角色不同,GPT-5.2 展现出了对公理(如勒让德公式)的熟练运用能力,甚至在哈佛数学家 Noam Elkies 的研究基础上,推导出了更为完备的解法。
长尾难题的终结者
菲尔兹奖得主陶哲轩(Terence Tao)对这一现象保持着敏锐的关注。他在 GitHub 上详细记录了 8 个由 AI 取得自主进展的案例,并提出了一个深刻的洞见:AI 的优势在于其无限的“可扩展性”。
在数学领域,存在大量晦涩但并非不可解的“长尾”问题,人类数学家往往受限于精力而无法面面俱到。AI 的介入,恰好填补了这一空白。它不知疲倦,能够处理海量的逻辑分支,这使得机器在攻克这类问题上展现出了超越人类的效率。
形式化工具构建的信任闭环
单纯的模型进化并非全部答案,生态系统的完善同样关键。Harmonic 公司开发的 Aristotle 等形式化工具,充当了“翻译官”与“裁判员”的角色。它们能将大模型生成的自然语言推理,自动转化为计算机可验证的代码(如 Lean 语言)。
Harmonic 创始人 Tudor Achim 强调,比解题数量更重要的是学术界的态度转变。当世界顶尖的数学教授开始公开承认并使用 AI 工具辅助研究,这本身就是对 AI 逻辑推理能力最有力的背书。我们正处于一个转折点:AI 不再仅仅是模仿者,它正在成为探索人类知识边界的强力队友。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译






评论 (0)
暂无评论,快来发表第一条评论吧!