一篇论文引发“数学万能键”狂欢后,反对者泼来一盆冷水

一场被互联网放大的“数学大一统”
数学圈很少像 AI 圈那样动不动就“颠覆一切”,但这一次,互联网还是把情绪拉满了。
事情的起点,是 Andrzej Odrzywołek 的一篇论文《All Elementary Functions from a Single Operator》。论文的核心主张听上去非常迷人:只要给定变量、常数 1,再加上一个形如“exp-minus-log”的单一构造操作,理论上就能拼出全部“初等函数”。从加减乘除,到三角函数、双曲函数,一路搭积木似地建出来。这样的叙事,天然很适合社交媒体传播——简单、统一、带一点“万物归一”的哲学气味。
很快,夸赞声就冒了出来。有人把它说成数学突破,有人甚至联想到数字电路里的 NAND 门,仿佛找到了连续世界中的“万能门”。再夸张一点的说法,已经开始把它往计算机工程和机器学习基础设施重构上扯了。老实说,这种熟悉的配方我们在科技新闻里见得太多:一个漂亮的理论结果,被包装成下一代产业革命的起点。
Robert Smith 的这篇评论,恰恰扮演了那个不太讨喜、但很有必要的人:他没有否认原论文的巧妙,反而明确承认,在作者自己限定的定义里,这个定理是成立的,而且很聪明。真正的问题在于,“elementary function(初等函数)”这个词,在数学传统中的含义,比论文标题暗示的要宽得多。一旦回到更标准的定义,事情就不再那么圆满了。
争议不在技巧,而在“初等函数”这四个字
这场讨论最有意思的地方,不在于某个公式写法是否漂亮,而在于一个词的边界究竟画到哪里。
在 19 世纪以来的经典数学语境里,所谓初等函数,通常不是只包含有理函数、指数、对数和有限次组合。它还包括一类极其关键的东西:代数方程的根,更准确地说,是“任意多项式根的局部分支”。这听上去很学院派,但你可以把它理解为:如果某个函数是由一个多项式方程隐式定义出来的,而这个方程的系数本身来自先前构造出的函数,那么它通常也被算作初等函数体系的一部分。
这件事看似只是术语口径问题,实际上决定了论文标题是否“说大了”。Odrzywołek 论文里使用的是一个被严格列举、总数为 36 个符号的“初等”清单。在这个自定义宇宙里,结论没有问题。可 Robert Smith 的批评是:标题没有提醒读者,这里的“初等”并不是数学界更常见的那个版本。换句话说,这更像是在一个精心裁剪过的规则集里完成了统一,而不是拿下了所有通常意义上的初等函数。
这就像你宣布“我发明了一把能打开所有锁的钥匙”,结果仔细一看,你所谓的“所有锁”,指的是你自家展柜里那 36 把。不能说你没本事,但标题确实容易让围观群众误会。
反驳的核心:五次方程把“万能性”卡住了
Smith 的反驳并不走情绪路线,而是拿出了一件数学史上久经考验的武器:单值化、解析延拓和单值群,也就是 monodromy group,再加上 Khovanskii 的拓扑 Galois 理论。
如果你对这些名词不熟,也不用立刻关网页。粗略说,这套方法是用“函数沿着复平面绕圈以后,分支会怎么交换”来判断一个函数究竟有多复杂。对由有理函数、指数、对数,以及 Odrzywołek 那种 exp-minus-log 构造递归生成出来的表达式,Smith 证明它们对应的单值群始终是“可解群”。这四个字很关键,因为它意味着:这些函数的分支结构虽然可以复杂,但复杂得仍然有某种层层拆解、最终被驯服的秩序。
问题来了。标准初等函数里包含代数方程的根,而某些代数方程——尤其是“泛五次方程”的根——其单值群是著名的 S5,也就是五个对象的全对称群。这个群不可解。不可解,不是说数学家“不会解”,而是说它不可能被你手上这套由指数、对数及类似操作反复组合的有限表达体系完整生成。
这就是整篇批评文章最锋利的一刀:如果某个标准意义下的初等函数,其单值群不可解,而所有 EML 表达式的单值群都可解,那么 EML 就不可能覆盖全部标准初等函数。逻辑上非常干净,几乎没什么留白。它不是说原论文“错了”,而是说原论文的标题和传播语境,把结论讲得比它真正做到的更大了。
说得更直白一点,EML 也许是一把非常精致的瑞士军刀,但它不是《指环王》里的至尊魔戒。至少,五次方程这道坎,它就跨不过去。
为什么这件事在今天格外值得看
如果这只是数学家之间对术语边界的争论,按理说不会在科技圈掀起这么大波澜。可眼下的技术环境,太容易放大“统一表示”“单一原语”“基础重构”这类叙事了。
过去几年,从深度学习里的 Transformer“统一”多模态,到软件工程里用一种中间表示统管编译、优化和推理,再到硬件世界里人们不断寻找更通用的指令原语,科技产业对“少即是多”的迷恋已经写进了时代情绪里。所以,当一篇数学论文声称只靠一个操作就能生成全部初等函数时,它被一些人自动翻译成“连续数学世界的 NAND 门”,几乎是必然的。
但数学和工程都反复证明过一件事:统一的形式很诱人,统一的代价却常常被低估。你当然可以把很多东西编码进一个原语里,可表达能力、可解释性、计算代价、定义边界,往往要一起付账。就像 lambda calculus 确实能表达很多计算过程,但现实中的编程语言并不会因此只留下一个抽象符号;又像神经网络理论上能逼近大量函数,但工程师仍然需要模块化结构、归纳偏置和专用算子。
因此,这场争论最有价值的提醒,不是“某论文被打脸”,而是我们该如何看待“统一理论”的传播方式。一个结论在严格定义下成立,不代表它在公众理解下也自动成立。尤其在 AI 和计算领域,理论上的“可表达”,和工程上的“可用、可算、可维护”,中间隔着不止一层楼。
这不是坏消息,反而是一次健康的校准
我倒不觉得这篇批评文章会让原论文失去意义。恰恰相反,它把这项工作放回了一个更准确的位置:不是“数学基础设施大重建”的发令枪,而是一项很漂亮、很有启发性的形式化结果。它让人重新思考,指数、对数和解析延拓的组合到底能走多远,也让更多圈外人第一次接触到拓扑 Galois 理论这种冷门但迷人的工具。
科技圈其实很需要这种“降温式报道”。不是为了扫兴,而是为了让真正有价值的东西不被过度营销吞掉。今天我们已经见过太多例子:一个还在论文阶段的模型,被说成通用人工智能前夜;一个新的芯片架构,被说成摩尔定律接班人;一个数学构造,也差点被说成重新发明计算机科学。热闹当然有流量,但冷静才能留下判断力。
更值得玩味的问题是:为什么人们总爱把数学里的“表达能力”类比成工程里的“通用门”?这种类比并非完全错误,却很容易忽略背景条件。布尔电路中的 NAND 之所以伟大,不只是因为它理论上完备,更因为它在物理实现、制造成本、组合便利性上也成立。而连续函数世界中的某个“单一操作”,就算表达上接近完备,也未必自动具备同样的工程含义。
这也是我对这场争论的判断:Odrzywołek 的工作值得读,Smith 的批评更值得一起读。前者提供了一个优雅的构造视角,后者守住了数学定义的边界。真正成熟的科学讨论,从来不是“神作”与“笑话”的二选一,而是在赞叹技巧的同时,清醒地知道它究竟解决了什么,又没有解决什么。
如果你非要从这件事里提炼一句适合今天技术世界的箴言,我会选这一句:统一很美,但边界更重要。尤其当一个标题看起来像要包下整个宇宙时,我们最好先问一句——它说的“宇宙”,到底有多大?