一位美国 AI 研究者最近密集走访了中国多家头部 AI 实验室。行程本身就很说明问题:北京 36 小时内,他见了 Z.ai、月之暗面、清华、美团、小米、零一万物;此前还去了阿里巴巴。
他的直观感受是,北京 AI 圈的密度有点像湾区。
更有意思的是,他没有把中国实验室写成神秘机器,也没有写成全面领先。结论反而朴素:中国大模型公司更像一批优秀的 fast-follower,擅长把已经验证过的路线快速工程化、规模化。
这件事最该看的,不是某个模型榜单。是中国实验室为什么能追得快,以及这种快到底能撑到哪里。
发生了什么:一组走访观察,不是一份判决书
这次材料的价值,在于它来自一位美国 AI 研究者的实地走访。但也要先把边界说清:这是观察,不是系统调查;是样本印象,不是官方数据。
几个共性很集中。
| 观察点 | 看到的现象 | 能支撑的判断 |
|---|---|---|
| 访问对象 | 阿里巴巴、Z.ai、月之暗面、清华、美团、小米、零一万物等 | 覆盖头部机构,但不能代表整个中国 AI 行业 |
| 地理密度 | 北京 AI 圈被描述得像湾区一样高密度 | 人才、机构、资本和产品团队靠得很近,交流成本低 |
| 团队结构 | 学生和年轻研究者深度参与核心模型工作 | 更像高强度工程学校,不是少数明星独舞 |
| 组织文化 | 个人明星叙事弱于美国 | 有利于模型整合,未必天然带来 0 到 1 突破 |
| 开源实践 | 企业倾向开放基础模型,拿社区反馈,再做内部微调 | 开源更多是实用主义,不是纯理想主义 |
| 现实短板 | 英伟达算力仍受限,国内数据产业质量不足 | 追赶机制强,但天花板还在 |
最反常的一点,是中国实验室并不靠“神秘配方”追赶。
它们更像在做一件笨事:把 MoE、RL、Agent、评测、数据清洗、推理部署这些环节,一层层磨进去。每个环节吃一点增益,最后合成一个能打的模型。
这对开发者和企业客户都有现实影响。
开发者不能只看闭源大模型 API。国内开源模型的反馈速度和可改造性,已经足以进入工具链评估。企业客户也会更犹豫:到底买闭源 API,还是把开源模型拿回来做内部微调?这个选择会直接影响预算、团队配置和数据安全策略。
作者还提到一个细节:很多中国开发者大量使用 Claude,即使 Claude 在国内并不是顺畅可得的正式产品。
这说明国内 AI 需求不能简单套用“企业不爱买 SaaS”的老判断。只要工具真的提升开发效率,需求会自己钻出来。问题只剩一个:钱最后流向闭源 API、云厂商、自建模型,还是开源生态。
为什么中国实验室追得快:能把苦活压进流程
今天做大模型,不是把几个天才研究员关进楼里就能赢。
架构、数据、RL、评测、工具链、推理部署,每个环节都能抠出一点收益。难点不在单点聪明,而在把这些收益塞进最终模型里。
很多时候,一个研究者的漂亮想法要被牺牲。不是因为它不聪明,而是整体模型不买账。
美国实验室当然有顶级人才。作者提到的对照点是,美国更强调研究者个人声望、公开表达和职业跃迁。明星科学家的叙事,有时会反过来影响组织决策。
一个方案没进最终模型,背后可能不只是技术争论。还有 credit、晋升、名望和内部政治。
中国这边的优势,不是没人有 ego。人都有。区别在于,现阶段中国实验室更容易把 ego 压进工程流程里。
学生多,年轻研究者多,组织更愿意让他们深度参与核心模型工作。很多活不漂亮:清数据、搭评测、补工具链、跑消融、调推理。可大模型竞争偏偏离不开这些脏活细活。
“天下熙熙,皆为利来。”放在 AI 实验室里也成立。美国的“利”,很多时候绑定个人名望和职业跃迁;中国的“利”,更多绑定团队结果、模型表现和产品落地。
这不是道德评判,是激励结构差异。
我更愿意把中国实验室的强项称为“工程化追赶能力”。它不保证原创突破,但很适合把别人证明过的路线快速吃透,再用组织强度卷出结果。
这对投资者也有提醒:别只盯一两次榜单反超。更该看团队是否能持续迭代,是否能把开源反馈变成产品收入,是否能在算力不宽裕时仍然提升效率。
榜单会波动。组织能力不会一天长出来,也不会一天消失。
分水岭在哪里:算力、数据和商业闭环
别把这套优势神化。
英伟达算力仍是硬约束。材料里对国产替代芯片在推理上的反馈相对积极,但训练前沿模型,英伟达依然是金标准。没有足够训练算力,再强的工程纪律也会被物理现实按住。
数据也是短板。
作者听到的反馈是,国内数据产业质量还不够成熟。很多 RL 环境和训练数据,实验室需要自己造。大公司如字节跳动、阿里巴巴可以靠内部团队补,但这会抬高门槛。
小团队就更难。它们不一定输在模型想法,可能先输在数据管线、评测体系和算力调度。
政府支持存在,但细节不清。材料不能支撑“政府直接指挥技术路线”这种判断。把中国 AI 的追赶全部归因于补贴,是偷懒;把政府因素完全拿掉,也不现实。
更大的变量在商业需求。
中国企业过去对 SaaS 付费不积极,但 AI 未必走同一条路。它可能更像云:不是买一个漂亮软件界面,而是为算力、推理、开发效率和内部自动化付费。
如果 AI 像 SaaS,模型公司会很苦。客户付费慢,定制多,销售重,收入不够覆盖模型迭代成本。
如果 AI 像云,局面就变了。推理需求会变成基础设施支出。谁能把模型能力、部署成本和企业场景打通,谁就能吃到更稳定的需求。
所以接下来最该看三件事。
| 变量 | 为什么重要 | 具体看什么 |
|---|---|---|
| 算力 | 决定前沿训练上限 | 英伟达资源是否仍是瓶颈,国产芯片能否在推理侧扩大使用 |
| 数据 | 决定模型后期提升效率 | RL 环境、行业数据、评测体系是否能规模化,而不是靠实验室手工补 |
| 商业闭环 | 决定追赶能不能自我供血 | 开源反馈能否转成云收入、企业部署收入或开发者工具收入 |
对企业客户来说,最现实的动作不是立刻押注某一家模型公司。更稳妥的是延后“单一模型绑定”,保留多模型接入和开源替换空间。
对开发团队来说,Claude、国内闭源模型、国内开源模型会长期并存。工具链要按任务拆:写代码、做 Agent、跑内部知识库、处理敏感数据,未必该用同一个模型。
这次观察最有价值的地方,是把神话拆掉。
中国 AI 的强项不是魔法。它是高密度人才、低明星化组织、强执行文化、开源反馈和技术自持心态叠在一起。它能追得很快,也会被算力、数据和商业模式卡住。
模型看着是技术竞赛,底下是组织竞赛。谁能让聪明人少内耗、多交付,谁就先赢半步。
