一台“科学计算器”,也许真的能只靠一个运算符:数学家把 sin、log 和 π 都塞进了同一棵树

从布尔逻辑到连续数学:人们一直在等“那个万能门”
计算机科学里有一个很经典的浪漫时刻:你发现,原来整个布尔逻辑世界,并不需要一大堆不同元件。一个 NAND,或者一个 NOR,理论上就够了。与、或、非,全都能从它长出来。这种“从一个原子搭出一座城”的感觉,几乎是工程世界里最迷人的统一性之一。
但在连续数学里,事情一直没这么简洁。你想算个平方根,要用一套东西;想算对数,又是另一套;三角函数、指数函数、四则运算,各有各的脾气。科学计算器表面上不过几十个按键,背后其实是一个杂而全的函数动物园。也正因此,来自 Andrzej Odrzywołek 的这篇论文《All elementary functions from a single binary operator》会让很多人眼前一亮:他声称,只要一个二元运算符,再加上常数 1,就足以生成“科学计算器标准曲目”里的全部初等函数。
这个运算符写作 eml(x,y)=exp(x)-ln(y)。第一眼看上去,它不像一个会统一天下的角色,反而像是两个性格完全不同的函数——指数和对数——被硬拉到一起凑成的“怪组合”。但论文给出的结论相当大胆:加减乘除、乘方、开方、sin、cos、log,甚至常数 e、π 和虚数单位 i,都可以从这个单一运算构造出来。
一个有点别扭、但异常强大的新积木
先说最直观的部分。因为 eml(x,1)=exp(x)-ln(1),而 ln(1)=0,所以 exp(x)=eml(x,1) 立刻就出来了。论文还给出了 ln(x) 的构造式:ln(x)=eml(1,eml(eml(1,x),1))。乍看复杂,像是在玩某种数学套娃,但它的意义不是“写法更简洁”,而是“语法被极度统一”。
这件事的重要性,恰恰不在于人类以后会不会真的拿 eml 来手算三角函数——当然不会,谁也不想把高中数学重新翻译成一堆嵌套括号——而在于机器处理公式时,统一的表达形式会大幅降低搜索空间的异质性。传统符号计算和符号回归经常卡在一个问题上:候选表达式的语法树太复杂了,节点类型太多,加、减、乘、除、exp、log、sin、cos 各有各的规则,算法既要猜结构,又要猜函数类型,搜索起来像在一间工具房里盲摸螺丝刀。
EML 形式把它压缩成了一种极简单的文法:S -> 1 | eml(S,S)。换句话说,整棵树上所有内部节点长得一模一样。对于机器来说,这很像把“多种算子拼装的程序搜索”,变成“同构树上的参数优化”。这一步听上去抽象,但非常关键,因为它把符号表达式和现代深度学习常用的电路/计算图结构拉近了。
为什么这件事现在特别值得关注
这篇论文并不只是纯数学趣味题。它踩中的,是 AI 时代一个越来越热的交叉点:符号回归。
过去几年,大家见多了大模型写代码、做摘要、生成图片,但科学发现领域的一个隐秘主线,其实是让机器从数据里“找出公式”。比如,你给它一堆实验数据,它不只是做预测,而是反推出牛顿式、麦克斯韦式,或者至少某种可读的闭式表达。相比黑箱神经网络,这类方法的诱惑很大:科学家往往不只想要答案,更想知道规律本身。
问题在于,符号回归向来难做。传统做法常用遗传编程、枚举搜索、启发式剪枝,本质上像让机器在公式森林里瞎逛。树越深,算子越多,组合爆炸就越可怕。Odrzywołek 的一个聪明之处,是把 EML 树当作可训练电路,用 Adam 这类标准优化器直接训练,论文里展示了在树深不超过 4 的情况下,可以从数值数据中精确恢复某些闭式初等函数。
这让我觉得它最有意思的地方,不是“人类终于找到了连续数学的 NAND 门”——这个说法很酷,但多少有点宣传口吻——而是它给符号回归提供了一种新接口:统一语法、连续优化、再配合构造性证明。今天这个时间点,AI 社区正试图把神经网络的可训练性和符号系统的可解释性焊接到一起,EML 恰好像一枚小巧但锋利的铆钉。
这是不是革命?我更愿意把它看成一种“桥梁技术”
当然,看到这种论文,最容易犯的毛病就是兴奋过头。说到底,EML 并没有让数学本身变简单,它只是证明了“可以统一表示”。从人类书写、教学和直觉理解的角度,sin、sqrt、log 仍然是不同的概念。你不能因为它们都能写成 eml 的树,就假装它们在认知上没有差别。
更现实的问题是,统一表示未必意味着高效计算。一个函数虽然可表达,但如果对应的 EML 树极深、极长、数值稳定性又差,那它在工程上就未必好用。指数和对数都不是“温和”的函数,放在嵌套结构里,可能放大误差、制造复杂分支,尤其在复数域或边界条件附近,数值表现未必优雅。论文的贡献在“可构造、可统一”,不是“最好算、最好实现”。这两者之间还有很长一段路。
还有一个值得追问的点:这种统一性,到底是自然界真的偏爱,还是我们在形式系统里找到的一种巧妙编码?数学史上类似的故事并不少见。比如 λ 演算、组合子逻辑、图灵机,很多体系都能用极少原语表达丰富计算,但“可表达”与“适合人用”从来是两回事。EML 也是如此。它很可能不会进入中学课本,却有机会进入未来的自动定理证明器、科学 AI 平台,甚至某些编译器内部的中间表示层。
也许下一步,不是更像计算器,而是更像发现机器
我最喜欢这篇论文的一点,是它有一种久违的“冷门但不冷淡”的气质。它既不是追着流量跑的大模型新 benchmark,也不是某家科技公司发布会上的新名词,而是在一个看似偏门的问题上,突然给出一个让人会心一笑的答案:原来连续数学里,也可能藏着一个“万能门”。
如果这条路继续往前走,后续可能出现几种有趣的方向。其一,是把 EML 当作符号回归的标准化表示,与现有的遗传搜索、神经引导搜索、程序合成方法结合,看看谁更擅长从实验数据里挖出真正的公式。其二,是研究它在物理建模、控制系统、材料科学中的表现——这些领域最需要“既能拟合又能解释”的模型。其三,则是更基础的问题:是否还存在别的单一算子,具有更好的数值稳定性、表达紧凑性,甚至更适合硬件实现。
说得通俗一点,这篇论文像是给“公式搜索”这门手艺,递上了一把新扳手。它不一定是终极工具,但很可能是那种你起初觉得造型古怪,用过几次却发现非常顺手的家伙。
对普通读者来说,这个故事也有一种朴素的美感:我们习惯了把数学看作一柜子分门别类的工具,而这篇论文提醒我们,柜子底部也许还藏着一个暗格。打开之后,你发现那些看似彼此疏远的函数,原来能从同一种骨架上长出来。这种统一感,本身就是科学最迷人的时刻之一。
如果未来几年,科学 AI 真的从“会拟合曲线”走向“会写出定律”,那么像 EML 这种看似小众的工作,可能会被重新估值。因为真正的发现工具,很多时候不是更大的模型,而是更对的表示法。