Databricks 联合创始人拿下 ACM 大奖，却说“AGI 其实已经来了”：这句话该怎么听

核心摘要 Summary

Databricks 联合创始人兼 CTO Matei Zaharia 获得 2026 年 ACM Computing Prize，这不仅是对 Spark 和大数据时代的一次致敬，也像是给 AI 新周期按下了一个醒目的注脚。
比奖项更抓人的是他的判断——“AGI 已经在这里”，这句话听上去大胆，但背后其实是在提醒整个行业：别再拿人类的标准去误读机器的能力边界。

硅谷很少缺热闹，但有些新闻的分量，和融资数字、模型参数、发布会掌声不是一个维度。

这一次，主角是 Databricks 联合创始人兼 CTO、加州大学伯克利分校副教授 Matei Zaharia。美国计算机学会 ACM 将 2026 年 Computing Prize 授予了他，表彰他在分布式数据处理和数据基础设施领域的贡献。这个奖附带 25 万美元奖金，他表示将捐给慈善机构。

如果你对这个名字不算熟，Spark 你大概率听过。那套把“大数据”从笨重、缓慢、近乎折磨工程师的系统里解放出来的技术，正是 Zaharia 在伯克利读博期间做出来的。2009 年，Spark 作为开源项目推出，随后成为 Databricks 的技术基石。今天我们再回头看，会发现它像是上一个技术周期的“基础设施核爆点”：没有 Spark 这样的底层工具，后来的数据湖、机器学习平台、企业 AI 管线，很难长成今天的样子。

而比获奖消息更有火药味的，是 Zaharia 对 AGI 的一句话：“AGI 已经在这里了，只是它不是我们欣赏的那种形式。”

从 Spark 到 Databricks：一个技术人吃到了两代浪潮

科技行业最迷人的地方在于，真正改变世界的东西，常常不是最先上头条的产品，而是埋在底层的“水电煤”。Spark 就是典型。

2000 年代末，大数据是行业最热的词之一，但那时候的数据计算很像老式货运：能运，但慢，笨，还容易堵。Hadoop 时代的批处理很重要，却也让很多团队苦不堪言。Zaharia 做的事情，本质上是把分布式计算的效率、灵活性和开发体验往前推了一大截。Spark 的内存计算、统一的数据处理框架，让原本动辄几个小时的任务缩短到分钟级，企业终于能更像“使用工具”而不是“伺候系统”。

这是为什么 ACM 会把奖给他。因为这不是单点创新，而是重塑了一整代计算基础设施。Databricks 后来的崛起——从云数据平台到 AI 数据底座，再到今天被视作企业级 AI 和 agent 基础设施的重要玩家——都建立在这条技术脉络上。公司累计融资超过 200 亿美元，估值达到 1340 亿美元，营收达到 54 亿美元。这样的数字当然耀眼，但我更在意的是另一层：Databricks 几乎是少数既踩中“大数据”又踩中“生成式 AI”的公司之一。

很多创业公司赶上一波风口已经足够幸运，能跨越两个时代并且仍站在台中央，说明它不是靠概念活着，而是靠基础设施活着。基础设施听起来无聊，却最不容易过时。

“AGI 已经来了”，这其实不是狂言，而是在纠偏

这几年，AGI 几乎成了科技圈最容易吵起来的话题之一。有人把它当成圣杯，有人把它当成营销，有人则把它当成一张永远可以延期兑现的支票。

Zaharia 的说法有意思，不在于他宣布了某个“历史时刻”，而在于他试图改写讨论的坐标系。他的核心观点是：别总拿人类的标准去套 AI。一个人要通过律师资格考试，需要长期积累知识、理解上下文、形成判断；而一个模型可以在极短时间内吞下海量事实，并在某些知识问题上给出正确答案。这并不意味着它“像人一样理解”，但也不意味着它不够强大。

换句话说，今天很多人一边高估 AI 的人格化能力，一边又低估 AI 的非人格化能力。我们总爱问：它有没有意识？会不会像人一样思考？可现实世界里，企业和科研机构真正想知道的是：它能不能更快找出药物候选分子？能不能减少实验次数？能不能把十万页技术文档梳理成人类可行动的结论？

如果从这个角度看，“AGI 已经来了”更像一句挑衅式修辞：它提醒我们，通用性未必等于拟人化。AI 不需要像一个坐在你旁边的同事，才算有价值。它只要在足够多的任务上表现出跨领域、可迁移、可规模化的能力，就已经在改写“智能”的定义。

我认同他的半句话，但保留半分怀疑。因为 AGI 这个词太容易偷换概念了。把“在很多任务上很好用”直接说成“AGI 已实现”，会制造新的混乱。今天的大模型和智能体很强，但仍然脆弱、依赖环境、容易受提示和上下文影响。它们是强大的工具，但距离一个稳定、可靠、真正自洽的通用智能系统，恐怕还隔着几层楼。

把 AI 当人，是今天最危险的误会之一

Zaharia 提到一个很现实的例子：一些热门 AI agent 看上去像“数字助理”，能自动帮你操作网页、处理账户、执行任务，体验很炫，但也可能是“安全噩梦”。

这个判断非常到位。过去一年，行业最流行的叙事之一就是让 agent 接管浏览器、邮箱、支付、企业系统，仿佛人人都能拥有一个不知疲倦的虚拟秘书。但问题恰恰在这里：如果它被包装得太像“一个值得信任的人”，用户就会天然放松警惕，把密码、账户权限、支付入口、内部系统一股脑交出去。

可它不是人。它不会真正理解“这笔钱不该花”“这个页面可能是钓鱼网站”“这个按钮点下去会引发审计事故”。它执行得越像模像样，风险反而越隐蔽。尤其当浏览器已经登录银行、企业后台、社交平台时，一个看似聪明的 agent 很可能成为攻击面最大的入口。

这也是今天 AI 产业一个被热情掩盖的现实：我们太会展示自动化的魔法，太不愿意认真谈授权边界、权限隔离、可追责机制和失败兜底。相比“AI 会不会抢工作”，我其实更担心另一件事——它会不会先把我们对系统安全的基本敬畏感抢走。

从这个角度说，Zaharia 的提醒很有价值。AI 越拟人，越需要去人格化地管理它。别把 agent 当同事，最好把它当高权限脚本；别问它“乖不乖”，要问它“有没有越权”。

真正值得期待的，不是会聊天的 AI，而是会做研究的 AI

比起舞台中央的 AGI 争论，Zaharia 更兴奋的方向其实更朴素：AI for research，或者更具体一点，面向科研和工程的搜索与推理辅助。

这件事的重要性，可能比又一个聊天机器人更大。因为聊天机器人解决的是“表达和交互”的问题，而科研型 AI 解决的是“发现和验证”的问题。前者让信息更顺滑，后者可能让新知识的生产速度发生变化。

他提到，AI 将来可以帮助自动化生物实验、汇编数据、模拟分子层级变化，甚至帮助判断实验路线是否有效。这不是空想。过去两年，从 AlphaFold 对蛋白质结构预测的冲击，到材料科学、药物筛选、芯片设计里越来越多的 AI 辅助工具，行业已经显露出一个趋势：AI 最有潜力的场景，不一定是最像人说话，而是最像显微镜、加速器、搜索引擎和实验助手的复合体。

这背后有一个非常关键的条件：减少幻觉。因为科研不是短视频评论区，差一点没关系；科研和工程里，一个漂亮但错误的答案，成本可能是数周实验、数百万资金，甚至错误的医疗判断。也正因此，Databricks 这类既做数据基础设施、又做企业 AI 平台的公司，未来的价值可能不只是“让模型跑起来”，而是“让模型在可控数据和可审计流程里跑得靠谱”。

如果说 2023 到 2025 年是“人人都想拥有聊天 AI”的几年，那么接下来更值得看的，很可能是“每个专业领域都在训练自己的研究型 AI”。医疗、法律、金融、制造、能源，都会出现不一样的智能层。它们不一定有统一人格，也不一定会陪你闲聊，但会越来越像一个专业设备，而不是一个电子宠物。

这个奖，表面在表彰过去，实际在给 AI 时代划重点

ACM 奖项向来有一种“盖章历史”的意味。它奖励的不只是某个产品的成功，更是某种技术路径被证明是对的。Zaharia 这次获奖，表面看是在纪念 Spark 和 Databricks 的起点，实际上却刚好卡在一个敏感时间点上：AI 正从炫技走向产业化，谁掌握数据、算力、工具链和落地场景，谁就更可能吃到下一轮红利。

这也是 Databricks 和 OpenAI、Anthropic、Google、Microsoft 这些公司不完全一样的地方。后者在争夺模型能力的上限，Databricks 更像在争夺“企业怎么安全、稳定、规模化使用 AI”的底盘。一个行业成熟的标志，不是最强模型多惊艳，而是普通企业能否真正把 AI 接到自己的数据和流程里，还不把自己搞崩。

所以这条新闻的意义，不只是“某位技术大牛获奖了”，也不只是“他说了一句很敢说的话”。更深一层看，它像是在提醒所有人：AI 的下一阶段，正在从“谁更像人”转向“谁更懂系统”。

这也留下一个很值得继续追问的问题：如果 AGI 的定义不再围绕人类相似性，而是围绕任务通用性和工具价值，那我们该怎么监管它、评估它、信任它？今天行业还没有统一答案。可这恰恰说明，真正的比赛才刚开始。

Databricks 联合创始人拿下 ACM 大奖，却说“AGI 其实已经来了”：这句话该怎么听

奖项与定调

技术底座

重塑计算

AGI 纠偏

概念挑衅

价值转向

核心场景

行业终局

竞争焦点

从 Spark 到 Databricks：一个技术人吃到了两代浪潮

“AGI 已经来了”，这其实不是狂言，而是在纠偏

把 AI 当人，是今天最危险的误会之一

真正值得期待的，不是会聊天的 AI，而是会做研究的 AI

这个奖，表面在表彰过去，实际在给 AI 时代划重点