Databricks 联合创始人拿下 ACM 大奖,却说“AGI 其实已经来了”:这句话该怎么听

硅谷很少缺热闹,但有些新闻的分量,和融资数字、模型参数、发布会掌声不是一个维度。
这一次,主角是 Databricks 联合创始人兼 CTO、加州大学伯克利分校副教授 Matei Zaharia。美国计算机学会 ACM 将 2026 年 Computing Prize 授予了他,表彰他在分布式数据处理和数据基础设施领域的贡献。这个奖附带 25 万美元奖金,他表示将捐给慈善机构。
如果你对这个名字不算熟,Spark 你大概率听过。那套把“大数据”从笨重、缓慢、近乎折磨工程师的系统里解放出来的技术,正是 Zaharia 在伯克利读博期间做出来的。2009 年,Spark 作为开源项目推出,随后成为 Databricks 的技术基石。今天我们再回头看,会发现它像是上一个技术周期的“基础设施核爆点”:没有 Spark 这样的底层工具,后来的数据湖、机器学习平台、企业 AI 管线,很难长成今天的样子。
而比获奖消息更有火药味的,是 Zaharia 对 AGI 的一句话:“AGI 已经在这里了,只是它不是我们欣赏的那种形式。”
从 Spark 到 Databricks:一个技术人吃到了两代浪潮
科技行业最迷人的地方在于,真正改变世界的东西,常常不是最先上头条的产品,而是埋在底层的“水电煤”。Spark 就是典型。
2000 年代末,大数据是行业最热的词之一,但那时候的数据计算很像老式货运:能运,但慢,笨,还容易堵。Hadoop 时代的批处理很重要,却也让很多团队苦不堪言。Zaharia 做的事情,本质上是把分布式计算的效率、灵活性和开发体验往前推了一大截。Spark 的内存计算、统一的数据处理框架,让原本动辄几个小时的任务缩短到分钟级,企业终于能更像“使用工具”而不是“伺候系统”。
这是为什么 ACM 会把奖给他。因为这不是单点创新,而是重塑了一整代计算基础设施。Databricks 后来的崛起——从云数据平台到 AI 数据底座,再到今天被视作企业级 AI 和 agent 基础设施的重要玩家——都建立在这条技术脉络上。公司累计融资超过 200 亿美元,估值达到 1340 亿美元,营收达到 54 亿美元。这样的数字当然耀眼,但我更在意的是另一层:Databricks 几乎是少数既踩中“大数据”又踩中“生成式 AI”的公司之一。
很多创业公司赶上一波风口已经足够幸运,能跨越两个时代并且仍站在台中央,说明它不是靠概念活着,而是靠基础设施活着。基础设施听起来无聊,却最不容易过时。
“AGI 已经来了”,这其实不是狂言,而是在纠偏
这几年,AGI 几乎成了科技圈最容易吵起来的话题之一。有人把它当成圣杯,有人把它当成营销,有人则把它当成一张永远可以延期兑现的支票。
Zaharia 的说法有意思,不在于他宣布了某个“历史时刻”,而在于他试图改写讨论的坐标系。他的核心观点是:别总拿人类的标准去套 AI。一个人要通过律师资格考试,需要长期积累知识、理解上下文、形成判断;而一个模型可以在极短时间内吞下海量事实,并在某些知识问题上给出正确答案。这并不意味着它“像人一样理解”,但也不意味着它不够强大。
换句话说,今天很多人一边高估 AI 的人格化能力,一边又低估 AI 的非人格化能力。我们总爱问:它有没有意识?会不会像人一样思考?可现实世界里,企业和科研机构真正想知道的是:它能不能更快找出药物候选分子?能不能减少实验次数?能不能把十万页技术文档梳理成人类可行动的结论?
如果从这个角度看,“AGI 已经来了”更像一句挑衅式修辞:它提醒我们,通用性未必等于拟人化。AI 不需要像一个坐在你旁边的同事,才算有价值。它只要在足够多的任务上表现出跨领域、可迁移、可规模化的能力,就已经在改写“智能”的定义。
我认同他的半句话,但保留半分怀疑。因为 AGI 这个词太容易偷换概念了。把“在很多任务上很好用”直接说成“AGI 已实现”,会制造新的混乱。今天的大模型和智能体很强,但仍然脆弱、依赖环境、容易受提示和上下文影响。它们是强大的工具,但距离一个稳定、可靠、真正自洽的通用智能系统,恐怕还隔着几层楼。
把 AI 当人,是今天最危险的误会之一
Zaharia 提到一个很现实的例子:一些热门 AI agent 看上去像“数字助理”,能自动帮你操作网页、处理账户、执行任务,体验很炫,但也可能是“安全噩梦”。
这个判断非常到位。过去一年,行业最流行的叙事之一就是让 agent 接管浏览器、邮箱、支付、企业系统,仿佛人人都能拥有一个不知疲倦的虚拟秘书。但问题恰恰在这里:如果它被包装得太像“一个值得信任的人”,用户就会天然放松警惕,把密码、账户权限、支付入口、内部系统一股脑交出去。
可它不是人。它不会真正理解“这笔钱不该花”“这个页面可能是钓鱼网站”“这个按钮点下去会引发审计事故”。它执行得越像模像样,风险反而越隐蔽。尤其当浏览器已经登录银行、企业后台、社交平台时,一个看似聪明的 agent 很可能成为攻击面最大的入口。
这也是今天 AI 产业一个被热情掩盖的现实:我们太会展示自动化的魔法,太不愿意认真谈授权边界、权限隔离、可追责机制和失败兜底。相比“AI 会不会抢工作”,我其实更担心另一件事——它会不会先把我们对系统安全的基本敬畏感抢走。
从这个角度说,Zaharia 的提醒很有价值。AI 越拟人,越需要去人格化地管理它。别把 agent 当同事,最好把它当高权限脚本;别问它“乖不乖”,要问它“有没有越权”。
真正值得期待的,不是会聊天的 AI,而是会做研究的 AI
比起舞台中央的 AGI 争论,Zaharia 更兴奋的方向其实更朴素:AI for research,或者更具体一点,面向科研和工程的搜索与推理辅助。
这件事的重要性,可能比又一个聊天机器人更大。因为聊天机器人解决的是“表达和交互”的问题,而科研型 AI 解决的是“发现和验证”的问题。前者让信息更顺滑,后者可能让新知识的生产速度发生变化。
他提到,AI 将来可以帮助自动化生物实验、汇编数据、模拟分子层级变化,甚至帮助判断实验路线是否有效。这不是空想。过去两年,从 AlphaFold 对蛋白质结构预测的冲击,到材料科学、药物筛选、芯片设计里越来越多的 AI 辅助工具,行业已经显露出一个趋势:AI 最有潜力的场景,不一定是最像人说话,而是最像显微镜、加速器、搜索引擎和实验助手的复合体。
这背后有一个非常关键的条件:减少幻觉。因为科研不是短视频评论区,差一点没关系;科研和工程里,一个漂亮但错误的答案,成本可能是数周实验、数百万资金,甚至错误的医疗判断。也正因此,Databricks 这类既做数据基础设施、又做企业 AI 平台的公司,未来的价值可能不只是“让模型跑起来”,而是“让模型在可控数据和可审计流程里跑得靠谱”。
如果说 2023 到 2025 年是“人人都想拥有聊天 AI”的几年,那么接下来更值得看的,很可能是“每个专业领域都在训练自己的研究型 AI”。医疗、法律、金融、制造、能源,都会出现不一样的智能层。它们不一定有统一人格,也不一定会陪你闲聊,但会越来越像一个专业设备,而不是一个电子宠物。
这个奖,表面在表彰过去,实际在给 AI 时代划重点
ACM 奖项向来有一种“盖章历史”的意味。它奖励的不只是某个产品的成功,更是某种技术路径被证明是对的。Zaharia 这次获奖,表面看是在纪念 Spark 和 Databricks 的起点,实际上却刚好卡在一个敏感时间点上:AI 正从炫技走向产业化,谁掌握数据、算力、工具链和落地场景,谁就更可能吃到下一轮红利。
这也是 Databricks 和 OpenAI、Anthropic、Google、Microsoft 这些公司不完全一样的地方。后者在争夺模型能力的上限,Databricks 更像在争夺“企业怎么安全、稳定、规模化使用 AI”的底盘。一个行业成熟的标志,不是最强模型多惊艳,而是普通企业能否真正把 AI 接到自己的数据和流程里,还不把自己搞崩。
所以这条新闻的意义,不只是“某位技术大牛获奖了”,也不只是“他说了一句很敢说的话”。更深一层看,它像是在提醒所有人:AI 的下一阶段,正在从“谁更像人”转向“谁更懂系统”。
这也留下一个很值得继续追问的问题:如果 AGI 的定义不再围绕人类相似性,而是围绕任务通用性和工具价值,那我们该怎么监管它、评估它、信任它?今天行业还没有统一答案。可这恰恰说明,真正的比赛才刚开始。