2026/4/3 9:47:19
网站建设
项目流程
python网站开发学习,蓬莱做网站价格,wordpress 注册界面,官方网站怎么备案45年数论猜想被GPT-5.2 Pro独立完成证明#xff0c;陶哲轩#xff1a;没犯任何错误
关注前沿科技 量子位 2026年1月19日 15:00 北京
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI
AI证明数学猜想#xff0c;这次来真的了。
OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔…45年数论猜想被GPT-5.2 Pro独立完成证明陶哲轩没犯任何错误关注前沿科技 量子位2026年1月19日 15:00北京梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI证明数学猜想这次来真的了。OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔德什猜想。论证过程经菲尔兹奖得主陶哲轩验证成立还被评价为“迄今为止最明确的第一类结果AI主要贡献”。这道题是埃尔德什问题库中的第281号由传奇数学家保罗·埃尔德什Paul Erdős与罗纳德·格雷厄姆Ronald Graham于1980年共同提出涉及同余覆盖系统与自然密度的深层关系。45年来这道题一直静静躺在问题库里等待解答。直到2025年1月17日一位名叫Neel Somani的研究者把这道题扔给了GPT-5.2 Pro。证明只用到GPT 5.2 Pro埃尔德什问题网站已收录AI证明结果。整个论证在无穷阿德尔整数环上展开借助哈尔测度和点态遍历定理结合紧致性论证完成了从逐点收敛到一致收敛的跃迁。按陶哲轩的话说它是“Furstenberg对应原理”的一个变体这是遍历理论与组合数学交叉领域的标准工具。但GPT-5.2 Pro的用法又有些不同它比通常的论证更依赖伯克霍夫定理。然而真正让陶哲轩印象深刻的不是证明方法本身而是AI没有犯错。让我更惊讶的是它避免了错误比如极限交换或量词顺序的失误这正是这道题最容易踩的坑。前几代大语言模型几乎肯定会在这些微妙之处栽跟头。为了验证这份证明陶哲轩亲自动手把整套遍历论论证翻译成了组合学语言用哈代-利特尔伍德极大不等式替代伯克霍夫定理重新走了一遍全部推导。结论证明成立。一个意外的发现正当大家讨论GPT-5.2 Pro的证明时一位网名KoishiChan的用户在评论区抛出了一个令人意外的发现这道题其实有更简单的解法而且所需的两个定理早在1936年和1966年就已经存在了。第一个是达文波特Harold Davenport与埃尔德什本人在1936年合作证明的密度收敛定理。第二个是罗杰斯定理首次发表于1966年的哈尔伯斯塔姆-罗斯专著《序列》第五章。把这两个经典结果拼在一起第281号问题几乎是直接推论。这就奇怪了。埃尔德什自己就是1936年那篇论文的合著者而他在1980年提出这道题时都没有意识到答案近在眼前。陶哲轩就此事专门写邮件请教了法国数学家特南鲍姆Tenenbaum。特南鲍姆确认“只要满足你提到的两个经典结果达文波特-埃尔多斯定理和罗杰斯定理问题就能立即得到解决”但他也猜测“问题的表述可能在某个环节被改动过”。不过目前没有人找到任何其他版本的表述所以只能按原样处理。更有意思的是2007年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶尖专家在解决另一道埃尔德什问题时同样不知道罗杰斯定理的存在直到特南鲍姆提醒他们才补上了引用。陶哲轩感慨“罗杰斯定理没有得到它应有的传播。它只出现在哈尔伯斯塔姆-罗斯那本书里没有单独发表文献引用寥寥无几。或许这场讨论能让更多研究筛法和同余覆盖的人注意到这个结果。”最终现在这道题有了两份证明一份来自GPT-5.2 Pro的遍历论路径一份来自KoishiChan挖出的经典文献组合。陶哲轩确认两者是“不同的证明”虽然在概念上有些重叠。如何评估AI数学的真实成功率消息传开后各路AI模型纷纷被拉来交叉验证。Gemini 3 Pro表示证明没有问题。另一位研究者用GPT-5.2 Pro反复检查论证细节AI认为唯一需要补充严格性的地方在第二步可以用法图引理绕过遍历论直接完成。不过陶哲轩指出这里法图引理的方向用反我刚教完研究生测度论这类错误见得太多了。随后又确认其实是对补集应用法图引理方向没问题论证成立。但陶哲轩同时发出了冷静的提醒。他写道评估AI工具真实成功率时最大的统计偏差来自强烈的报告偏差负面结果几乎不会被披露。如果某人或某AI公司把工具用在开放问题上但没有进展他们没有动力报告这个负面结论即使报告了也不太可能像正面结果那样在社交媒体上传播开来。尽管绝大多数集中在难度谱系的简单一端远不能说明中等难度的埃尔德什问题已经进入AI的射程范围。他推荐了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源项目系统记录前沿大语言模型在埃尔德什问题上的正面和负面结果。数据显示这些工具在埃尔德什问题上的真实成功率大约只有百分之一到二。但考虑到问题库里有超过600道未解难题这个比例仍然意味着一批数量可观且非平凡的AI贡献。参考链接[1]https://www.erdosproblems.com/forum/thread/281[2]https://x.com/neelsomani/status/2012695714187325745[3]https://mathstodon.xyz/tao/115911902186528812