ECMWF 把 AIFS 投入运行这件事,最容易被讲成“AI 天气预报来了”。

但真正有意思的反常点在这里:它没有把老系统 IFS 扔掉,而是并行运行。一个是长期使用的物理数值预报系统,一个是基于机器学习的新模型。行业最稳妥的选择,不是押注谁替代谁,而是把两者放在一起用。

这已经说明了问题。

AIFS 的效率优势很明显。传统 IFS 单次运行大约 30 分钟,AIFS 大约 3 分钟;ECMWF 称,IFS 单次运行能耗大约是 AIFS 的 1000 倍。对预报中心来说,这不是漂亮参数,而是每天要付的算力账和能源账。

但快,不等于在所有场景都更可信。天气和气候科学里的 AI,眼下更像一把利器,不是新天书。

AIFS 的突破在算力,不在“接管物理”

这里说的 AI,不是大语言模型,也不是聊天机器人在读天气图。

天气预报和气候建模里常说的 AI,主要是基于历史数据训练的机器学习模型。它会从再分析资料中学习天气状态之间的变化模式。再分析资料把观测、物理模型和数据同化整合在一起,形成连续的全球天气快照。

传统数值天气预报不一样。它在网格上求解大气运动、热力、水汽等物理方程。速度慢,耗能高,但物理约束内生在模型里。

这就形成了一个很清楚的对照:

对比项传统 IFS机器学习 AIFS更现实的判断
单次运行时间约 30 分钟约 3 分钟AIFS 适合更快生成预报和更多集合成员
能耗约为 AIFS 的 1000 倍明显更低成本优势是真突破
物理约束来自方程体系需要额外加入或事后修正不能只看平均误差
业务路线长期主力系统2025 年起投入运行ECMWF 选择并行,不是替代

这也是我不太买账“AI 已经颠覆气象学”这种说法的原因。

AIFS 的意义很大。它让天气预报中心能用更低成本跑更多方案,更新更快,集合预报也更有空间。Google、NVIDIA、华为、Microsoft 等公司近年推出的机器学习天气模型,也都在推动这条路线。

但物理一致性仍是硬门槛。

一个很具体的例子是负降水。机器学习模型可能给出小于零的降水量,这在物理上不可能。ECMWF 对 AIFS 的处理之一,是把预测出的负降水重新映射为零。

这类修正很实用,也很醒目。它提醒我们:模型能画出像样的天气图,不代表它天然知道什么不能发生。

对关注 AI 科学应用的科技读者来说,这里的动作很直接:少看“超过传统模型”的单点排名,多看它有没有物理约束、有没有业务并行验证、有没有极端天气评估。采购或引入类似系统时,也不该只拿速度和平均误差做决策。

极端天气不能用“跑得快”来背书

天气预报最有公共价值的地方,通常不是明天多云还是晴,而是台风路径、暴雨落区、热浪强度、破纪录低温。

这些场景也最容易暴露机器学习短板。

原因不复杂:极端事件样本少。机器学习模型如果主要从历史资料中学习,就容易把罕见事件学成“不太会发生”。一旦遇到破纪录事件,它可能低估频率,也可能低估强度。

近期一些研究把机器学习天气模型与 ECMWF 高分辨率物理模型做对比,发现常见机器学习模型在破纪录事件上有低估倾向。记录突破越大,误差可能越明显。

这件事对公共部门不是技术细节。

如果暴雨强度被低估,城市排水、水库调度、应急值守都可能晚一步。如果热浪被低估,医院、电网、养老机构的准备就可能不足。保险和再保险机构也不能只把更快的天气模型当成风险定价升级。

更现实的用法,是把机器学习预报当成高效率工具,而不是单一决策依据。

对防灾、能源和公共政策团队来说,比较稳的动作是:

  • 常规天气预报可以更多使用机器学习模型提高更新频率;
  • 极端天气预警仍要保留物理模型、集合预报和人工研判;
  • 遇到破纪录信号时,不要因为 AI 模型给出较低强度就自动降级响应;
  • 对关键业务,最好记录 AI 模型在本地历史极端事件中的误差,而不是照搬全球平均表现。

这不是保守。是风控。

计算更快,只能说明你能更快得到一个答案。这个答案在罕见天气上是否可靠,还要另算。

气候建模更不能丢掉物理方程

天气预报和气候建模经常被放在一起讲,但它们问的不是同一个问题。

天气预报问的是:从今天开始,未来几天或十几天天气怎样变化。它是短期外推。

气候建模问的是:如果二氧化碳排放改变,几十年后的温度、降水、极端事件统计会怎样变化。它还要回答反事实问题,比如如果人类没有大量排放温室气体,今天的气候统计会是什么样。

这类问题不能只靠历史数据训练出来。因为未来的边界条件在变,地球系统可能走到训练数据很少覆盖、甚至没有覆盖过的区域。

所以在气候科学里,机器学习更适合嵌入局部环节,而不是替代整个模型。

比如 Climate Modeling Alliance(CliMA)走的是混合路线。它用 Julia 和云原生架构重建气候模型,主体仍基于物理方程,但在雪盖等局部参数化模块中引入机器学习,并加入水量进出守恒这类硬约束。

这条路比较合理。雪盖过程在当前气候中有较多样本,机器学习有机会学到稳定关系。云过程就更难。气候变暖后,可能出现当前地球上缺少充分样本的更深对流云,历史数据给不了完整答案。

NASA 戈达德空间研究所的气候建模团队,也在用机器学习做模型校准。他们调整云内过程等关键参数,构造 450 组参数组合,再用一年的大气模拟结果对照热带气旋数量、地球顶层能量收支等指标。

这类工具能减少科研团队盲调参数的成本。它服务的是物理模型,不是绕开物理模型。

所以,接下来判断 AI 天气和气候模型,不该只看发布会上那句“超过传统模型”。更该看三个硬条件:

观察点为什么重要没做到会怎样
是否稳定满足物理守恒降水、能量、水汽不能随意出错结果看着像预报,但可能物理不成立
是否减少破纪录事件低估防灾最怕低估尾部风险快速预报反而可能带来误判
是否能经受气候边界条件变化气候模型要回答未来情景和反事实历史拟合好,不代表未来可靠

对科研和政策从业者来说,更稳的路线是混合使用:把机器学习放进可验证、可约束的局部模块,用它提速、校准、扩展集合规模;涉及气候情景、极端风险和公共安全决策时,仍要把物理模型放在底座。

这也是 ECMWF 并行运行 AIFS 和 IFS 给出的真实信号:AI 已经进入一线,但一线没有把物理模型撤下去。

开头那个问题可以回到这里。AIFS 的上线当然重要,但它证明的不是“气候科学被 AI 接管”,而是气象业务找到了一种更省算力的新工具。工具越强,越要知道刀口在哪里。