Databricks 联合创始人拿下 ACM 大奖,却说“AGI 其实已经来了”:这句话该怎么听

人工智能 2026年4月8日
Databricks 联合创始人拿下 ACM 大奖,却说“AGI 其实已经来了”:这句话该怎么听
Databricks 联合创始人兼 CTO Matei Zaharia 获得 2026 年 ACM Computing Prize,这不仅是对 Spark 和大数据时代的一次致敬,也像是给 AI 新周期按下了一个醒目的注脚。比奖项更抓人的是他的判断——“AGI 已经在这里”,这句话听上去大胆,但背后其实是在提醒整个行业:别再拿人类的标准去误读机器的能力边界。

硅谷很少缺热闹,但有些新闻的分量,和融资数字、模型参数、发布会掌声不是一个维度。

这一次,主角是 Databricks 联合创始人兼 CTO、加州大学伯克利分校副教授 Matei Zaharia。美国计算机学会 ACM 将 2026 年 Computing Prize 授予了他,表彰他在分布式数据处理和数据基础设施领域的贡献。这个奖附带 25 万美元奖金,他表示将捐给慈善机构。

如果你对这个名字不算熟,Spark 你大概率听过。那套把“大数据”从笨重、缓慢、近乎折磨工程师的系统里解放出来的技术,正是 Zaharia 在伯克利读博期间做出来的。2009 年,Spark 作为开源项目推出,随后成为 Databricks 的技术基石。今天我们再回头看,会发现它像是上一个技术周期的“基础设施核爆点”:没有 Spark 这样的底层工具,后来的数据湖、机器学习平台、企业 AI 管线,很难长成今天的样子。

而比获奖消息更有火药味的,是 Zaharia 对 AGI 的一句话:“AGI 已经在这里了,只是它不是我们欣赏的那种形式。”

从 Spark 到 Databricks:一个技术人吃到了两代浪潮

科技行业最迷人的地方在于,真正改变世界的东西,常常不是最先上头条的产品,而是埋在底层的“水电煤”。Spark 就是典型。

2000 年代末,大数据是行业最热的词之一,但那时候的数据计算很像老式货运:能运,但慢,笨,还容易堵。Hadoop 时代的批处理很重要,却也让很多团队苦不堪言。Zaharia 做的事情,本质上是把分布式计算的效率、灵活性和开发体验往前推了一大截。Spark 的内存计算、统一的数据处理框架,让原本动辄几个小时的任务缩短到分钟级,企业终于能更像“使用工具”而不是“伺候系统”。

这是为什么 ACM 会把奖给他。因为这不是单点创新,而是重塑了一整代计算基础设施。Databricks 后来的崛起——从云数据平台到 AI 数据底座,再到今天被视作企业级 AI 和 agent 基础设施的重要玩家——都建立在这条技术脉络上。公司累计融资超过 200 亿美元,估值达到 1340 亿美元,营收达到 54 亿美元。这样的数字当然耀眼,但我更在意的是另一层:Databricks 几乎是少数既踩中“大数据”又踩中“生成式 AI”的公司之一。

很多创业公司赶上一波风口已经足够幸运,能跨越两个时代并且仍站在台中央,说明它不是靠概念活着,而是靠基础设施活着。基础设施听起来无聊,却最不容易过时。

“AGI 已经来了”,这其实不是狂言,而是在纠偏

这几年,AGI 几乎成了科技圈最容易吵起来的话题之一。有人把它当成圣杯,有人把它当成营销,有人则把它当成一张永远可以延期兑现的支票。

Zaharia 的说法有意思,不在于他宣布了某个“历史时刻”,而在于他试图改写讨论的坐标系。他的核心观点是:别总拿人类的标准去套 AI。一个人要通过律师资格考试,需要长期积累知识、理解上下文、形成判断;而一个模型可以在极短时间内吞下海量事实,并在某些知识问题上给出正确答案。这并不意味着它“像人一样理解”,但也不意味着它不够强大。

换句话说,今天很多人一边高估 AI 的人格化能力,一边又低估 AI 的非人格化能力。我们总爱问:它有没有意识?会不会像人一样思考?可现实世界里,企业和科研机构真正想知道的是:它能不能更快找出药物候选分子?能不能减少实验次数?能不能把十万页技术文档梳理成人类可行动的结论?

如果从这个角度看,“AGI 已经来了”更像一句挑衅式修辞:它提醒我们,通用性未必等于拟人化。AI 不需要像一个坐在你旁边的同事,才算有价值。它只要在足够多的任务上表现出跨领域、可迁移、可规模化的能力,就已经在改写“智能”的定义。

我认同他的半句话,但保留半分怀疑。因为 AGI 这个词太容易偷换概念了。把“在很多任务上很好用”直接说成“AGI 已实现”,会制造新的混乱。今天的大模型和智能体很强,但仍然脆弱、依赖环境、容易受提示和上下文影响。它们是强大的工具,但距离一个稳定、可靠、真正自洽的通用智能系统,恐怕还隔着几层楼。

把 AI 当人,是今天最危险的误会之一

Zaharia 提到一个很现实的例子:一些热门 AI agent 看上去像“数字助理”,能自动帮你操作网页、处理账户、执行任务,体验很炫,但也可能是“安全噩梦”。

这个判断非常到位。过去一年,行业最流行的叙事之一就是让 agent 接管浏览器、邮箱、支付、企业系统,仿佛人人都能拥有一个不知疲倦的虚拟秘书。但问题恰恰在这里:如果它被包装得太像“一个值得信任的人”,用户就会天然放松警惕,把密码、账户权限、支付入口、内部系统一股脑交出去。

可它不是人。它不会真正理解“这笔钱不该花”“这个页面可能是钓鱼网站”“这个按钮点下去会引发审计事故”。它执行得越像模像样,风险反而越隐蔽。尤其当浏览器已经登录银行、企业后台、社交平台时,一个看似聪明的 agent 很可能成为攻击面最大的入口。

这也是今天 AI 产业一个被热情掩盖的现实:我们太会展示自动化的魔法,太不愿意认真谈授权边界、权限隔离、可追责机制和失败兜底。相比“AI 会不会抢工作”,我其实更担心另一件事——它会不会先把我们对系统安全的基本敬畏感抢走。

从这个角度说,Zaharia 的提醒很有价值。AI 越拟人,越需要去人格化地管理它。别把 agent 当同事,最好把它当高权限脚本;别问它“乖不乖”,要问它“有没有越权”。

真正值得期待的,不是会聊天的 AI,而是会做研究的 AI

比起舞台中央的 AGI 争论,Zaharia 更兴奋的方向其实更朴素:AI for research,或者更具体一点,面向科研和工程的搜索与推理辅助。

这件事的重要性,可能比又一个聊天机器人更大。因为聊天机器人解决的是“表达和交互”的问题,而科研型 AI 解决的是“发现和验证”的问题。前者让信息更顺滑,后者可能让新知识的生产速度发生变化。

他提到,AI 将来可以帮助自动化生物实验、汇编数据、模拟分子层级变化,甚至帮助判断实验路线是否有效。这不是空想。过去两年,从 AlphaFold 对蛋白质结构预测的冲击,到材料科学、药物筛选、芯片设计里越来越多的 AI 辅助工具,行业已经显露出一个趋势:AI 最有潜力的场景,不一定是最像人说话,而是最像显微镜、加速器、搜索引擎和实验助手的复合体。

这背后有一个非常关键的条件:减少幻觉。因为科研不是短视频评论区,差一点没关系;科研和工程里,一个漂亮但错误的答案,成本可能是数周实验、数百万资金,甚至错误的医疗判断。也正因此,Databricks 这类既做数据基础设施、又做企业 AI 平台的公司,未来的价值可能不只是“让模型跑起来”,而是“让模型在可控数据和可审计流程里跑得靠谱”。

如果说 2023 到 2025 年是“人人都想拥有聊天 AI”的几年,那么接下来更值得看的,很可能是“每个专业领域都在训练自己的研究型 AI”。医疗、法律、金融、制造、能源,都会出现不一样的智能层。它们不一定有统一人格,也不一定会陪你闲聊,但会越来越像一个专业设备,而不是一个电子宠物。

这个奖,表面在表彰过去,实际在给 AI 时代划重点

ACM 奖项向来有一种“盖章历史”的意味。它奖励的不只是某个产品的成功,更是某种技术路径被证明是对的。Zaharia 这次获奖,表面看是在纪念 Spark 和 Databricks 的起点,实际上却刚好卡在一个敏感时间点上:AI 正从炫技走向产业化,谁掌握数据、算力、工具链和落地场景,谁就更可能吃到下一轮红利。

这也是 Databricks 和 OpenAI、Anthropic、Google、Microsoft 这些公司不完全一样的地方。后者在争夺模型能力的上限,Databricks 更像在争夺“企业怎么安全、稳定、规模化使用 AI”的底盘。一个行业成熟的标志,不是最强模型多惊艳,而是普通企业能否真正把 AI 接到自己的数据和流程里,还不把自己搞崩。

所以这条新闻的意义,不只是“某位技术大牛获奖了”,也不只是“他说了一句很敢说的话”。更深一层看,它像是在提醒所有人:AI 的下一阶段,正在从“谁更像人”转向“谁更懂系统”。

这也留下一个很值得继续追问的问题:如果 AGI 的定义不再围绕人类相似性,而是围绕任务通用性和工具价值,那我们该怎么监管它、评估它、信任它?今天行业还没有统一答案。可这恰恰说明,真正的比赛才刚开始。

Summary: 我的判断是,Matei Zaharia 这句“AGI 已经来了”并不意味着通用人工智能大功告成,而是在逼行业放弃一种偷懒的讨论方式:别总问 AI 像不像人,要问它到底擅长什么、又会在哪些地方出错。未来三年,真正跑出来的不会只是更会聊天的模型,而是那些能嵌进科研、工程和企业流程、同时把安全和可靠性做扎实的 AI 系统。热闹会继续,但最后赢的,大概率还是基础设施派。
AGIMatei ZahariaDatabricksACM Computing PrizeSpark大数据分布式数据处理数据基础设施机器学习平台企业 AI 管线