技术

OpenAI通用模型攻破八十年悬而未决的几何难题,并非数学专用模型

Susan Hill

OpenAI的通用推理模型刚刚打破了离散几何中一个八十年悬而未决的猜想。这个模型并不是为做数学而训练的。它运行在与撰写电邮、写Python代码同一套架构上,而周二它产出了一族新的几何配置,目前已由四位数学家完成核验。

这个问题的表述简单得近乎欺骗。在平面上取n个点。它们中有多少对可以彼此相距恰好相同的距离,比如一个单位?Paul Erdős在1946年提出这个问题,并给出一个上界:大约n的(1加o(1))次方,意思是”仅仅略多于线性”。几十年来,最优的已知配置都来自正方网格的各种变体,而网格几乎贴着这个天花板。在岗位上的数学家把这条上界当作本质上紧致的来处理。

OpenAI的模型并没有把上界收紧。它把这条线打断了。系统给出了一整族点的排列,其中至少有n的(1加δ)次方对单位距离配对,其中δ为某个大于零的固定常数。这不是细化,而是对该猜想核心断言的反例。复核工作的四位数学家之一Will Sawin把这个新指数化简为一个干净的表达式。Thomas Bloom、Melanie Wood与Noga Alon,复核组其余三人,确认了该构造站得住脚。

方法上有意思的是,它并不是从几何内部冒出来的。模型跨入了代数数论,将高斯整数推广到其他代数数域,并把所得格点视为候选配置。那座桥,把几何拉进数论的那一步,正是人类八十年一再错过的跃迁。在一场数学讲座里,这种动作通常换来一阵缓慢的点头和一段长长的沉默。

在岗数学家的反应在头一天就到了。Fields奖得主Timothy Gowers称之为”AI解决一道真正广为人知的数学问题、第一个真正清晰的例子”。OpenAI研究员Alexander Wei写道,这个结果是Annals of Mathematics的审稿人会”毫无保留地”接收的那种。最后这一断言是可以验证的。证明已以PDF形式公开,并附有一份说明文档,更广泛的数学界正在阅读。

OpenAI所倚靠的叙事是:这是AI系统首次自主解决数学某一领域中处于中心位置的一个重要开放问题。”自主”二字在这里承载着大量重量。模型给出了构造;在任何公告发出之前,证明经过四位真人数学家的筛选、打磨与压力测试。这个区分要紧,因为OpenAI从前在同一位置上站过。

2025年10月,公司散布过一项说法,说另一款内部模型已解决Erdős提出的十个开放问题。数日之内,数学家们就指出这些”答案”中有数项要么是已知结果,要么干脆是错的。OpenAI撤回了那次大范围的说法。那一幕正是本周公告以核验者的名字而非模型名字打头的原因。四位数学家就是保证。

另一处值得收住的细节是,是哪一类模型产出了这一结果。OpenAI没有公开系统的名字,只说它是一款通用推理模型,与撑起聊天、起草代码、回复客服工单的那同一支模型同源。回路里没有任何数学专用变体。处理日常对话的同一套架构处理了这一件事。这就暗示,AI驱动数学的瓶颈,也许从来就不是一个为数学微调的模型。也许是算力与耐心。

那条瓶颈被冲破,才是真正的故事。长期以来,研究者间的工作假设是,真正原创的数学需要专门构建的系统:定理证明器、形式化验证框架、在证明语料上训练的窄模型。周二落地的,是另一类证据。一个推理器对准一个著名的、尚未解决的、八十岁的问题;给它足够的思考空间,它给出了Sawin、Bloom、Wood、Alon一致认为正确的东西。从聊天窗口到Erdős的那段路,比想象中短。

几条警语仍然有效。模型并未公开。最初的四人小组之外的独立小组会在接下来几周读这份证明,而Annals或其他顶级期刊的完整同行评审过程将耗时数月。指数δ很小。该构造并不解决球面上或更高维度下相关的单位距离问题。这些都不会缩小周二发生的事情的体量。只是为它定位。

改变的是预期。一年前,关于AI能否进入数学的提问是:这些系统会不会有一天产出有分量的原创证明。从本周起,问题换成了:下一道开放问题会在哪里塌掉,以及核验证明的数学家是否会持续得到像Alon与同事在这里得到的那种署名信用。

1946年的一项猜想是那种安安静静放在架上、等着合适的手把它拿下来的物件。本周把它拿下来的那只手跑在一组GPU集群上,并未为这项工作受过训练,在四位数学家注视的同时把活计干完。

讨论

有 0 条评论。