两周前,OpenAI宣称其模型推翻了一个已有80年历史的离散几何猜想。
这听起来像AI数学能力的一次高光。但数学界真正卡住的地方,不是“AI会不会做题”。而是:如果一个成果来自封闭模型,提示词、训练数据和算力都不公开,外部数学家该怎么判断它的科学意义?
国际数学联盟已经背书《莱顿人工智能与数学宣言》。这份文件由16名研究者历时8个月起草,2026年6月2日发布。它警告的不是某一个模型,而是科技公司和AI工具正在进入数学研究的证明验证、署名归属、传播节奏和资助结构。
我的判断很简单:这不是数学界全面反AI。宣言承认AI可能有用。它要划的线,是透明、归属和共同体评估。
宣言为何此时发布:公司发布速度快过共同体验证
OpenAI的几何成果,是这次讨论的现实参照。
材料显示,OpenAI发布了论文,也发布了独立数学家的评论。但它没有披露提示、训练数据、所用算力等信息。这些信息未必直接决定证明对错,却会影响外界判断:模型贡献到底来自推理、搜索、记忆、人工筛选,还是大量计算试错。
这里要很谨慎。现有材料不能支持“OpenAI成果错误”这种说法。争议点也不在这里。
真正的问题是传播路径变了。过去一个数学结果要进入共同体,通常靠公开证明、审稿、修改、引用和再使用。现在,公司新闻稿、博客和产品叙事可能先把“重大突破”的帽子戴上,同行评议反而变成后置流程。
数学和围棋不一样。AlphaGo赢棋,规则和胜负清楚。数学证明不是比分牌。它要被许多人读懂、挑错、接上已有文献,才算变成共同知识。
这也是宣言在这个时间点出现的原因:AI做出某个结果并不可怕,可怕的是验证成本被转嫁给学界,传播收益却先被公司拿走。
数学家担心什么:五件事都指向控制权
《莱顿宣言》的担忧,可以压成五类。它们看似分散,其实都在问同一个问题:数学共同体还能不能决定什么算证明、谁该署名、哪些问题值得做。
| 担忧 | 具体风险 | 受影响的人 |
|---|---|---|
| 错误证明污染文献 | AI生成的论证看似合理,但可能埋有逻辑漏洞 | 审稿人、博士生、早期研究者要花更多时间排雷 |
| 训练数据和引用问题 | 模型吸收论文却不能清楚标注来源,甚至牵涉版权 | 原作者的信用被稀释,引用链变模糊 |
| AI使用激励扭曲评价 | “用了先进AI工具”被当成加分项 | 招聘、基金、奖励可能偏向有工具和算力的人 |
| 公司新闻稿绕过同行评议 | 重大结果先被包装传播,再等待共同体验证 | 期刊和学会要被迫追赶传播节奏 |
| 科技公司影响研究方向 | 公司提供职位、奖金、算力和曝光 | 更适合AI处理的问题可能被优先研究 |
这张表背后,是一个很现实的压力差。
大学经费有限,青年学者岗位不稳,期刊审稿本来就靠同行义务劳动。科技公司能提供薪酬、算力和曝光。对研究者来说,接不接公司项目不只是态度问题,也可能是职业选择问题。
所以宣言不是在说“数学家不要用AI”。它更像是在提醒:合作可以有,但不能让掌握算力和传播渠道的一方,同时定义成果价值。
这对关注AI科研影响的科技读者,意味着判断新闻时要换一个问题。不要只看“模型解决了什么难题”,还要看论文、提示、数据、算力和外部验证有没有足够信息。
对高校研究者和学术出版从业者,影响更直接。投稿系统可能需要增加AI使用申报;编辑要决定是否要求补充工具信息;审稿人要判断“AI辅助证明”的责任归属;基金评审也要避免把“接入了更强模型”误当成研究质量本身。
一个可能出现的动作是:期刊和学会会延后接受只靠公司发布包装的重大数学结果,要求更完整的披露材料。研究团队也会更谨慎地记录AI使用过程,避免到投稿时说不清贡献边界。
宣言给出的边界:披露、规则和公共算力
宣言给出的建议并不激进。
个人研究者要披露AI使用,并对结果正确性负责。学会、期刊和会议要制定审稿规范,尤其要准备处理那些通过“非常规方式”宣布的重大数学结果。政策层面则要保护作者权利,监管AI产业,并投资公共计算基础设施。
这几条边界里,最难的是公共算力。
如果只有大公司能训练、运行和测试最强模型,学界就很难独立评估AI在数学研究中的真实作用。没有可用的公共计算基础设施,透明会停在倡议层面,验证成本仍由个人学者承担。
国际数学联盟的背书也要看清边界。它不是禁令,也不是监管规则。它不能约束OpenAI、Google DeepMind或其他公司怎么发布成果。
但它会影响学界内部的默认规则。期刊是否要求披露AI使用,学会是否出台审稿规范,基金机构是否把工具可及性和研究贡献区分开,这些会决定宣言是不是只停在纸面上。
接下来真正该观察的不是哪家公司又宣布“AI解决数学难题”。更关键的是三件事:
- 论文和投稿系统是否开始要求AI使用披露;
- 期刊、学会是否要求补充提示、工具和验证信息;
- 公共算力是否能让学界独立复核商业AI成果。
如果这三件事跟不上,数学界面对的就不是AI太聪明,而是共同体太被动。
回到开头那道几何猜想。一个AI结果可以很有价值,但它不能只靠公司叙事完成加冕。数学最硬的地方,从来不是谁先喊出答案,而是谁能让证明经得起旁人一寸一寸地检查。
