OpenAI 这次讲 Codex,最值得盯的不是模型分数,而是一个有点反常的数字:99.8%。
按 OpenAI 发布的研究,在其公司内部每周输出 token 中,Codex 占到 99.8%。平均员工超过 85% 的输出 token 来自 Codex。工程部门先用,后来法务、招聘、财务也跟上。
这个数字不能读成收入、利润,也不能直接翻译成员工效率。它只能说明一件事:在 OpenAI 这个前沿组织样本里,AI 的使用方式已经变了。人不只是向聊天框要答案,而是在把一段工作交给智能体跑。
Codex 不再只是写代码,而是在吃掉长任务
OpenAI 这篇研究的数据截至 2026 年 5 月。它的价值不在于证明所有公司都已经这样,而在于提前暴露了一个方向:智能体正在从“回答问题”,变成“承接任务”。
| 观察项 | OpenAI 研究中的变化 | 该怎么读 |
|---|---|---|
| 长周期任务 | 80.6% 的个人用户至少发起过一次估计超过 30 分钟人工工作量的 Codex 请求;70.2% 超过 1 小时;25.6% 超过 8 小时 | 用户开始委派完整任务,不只是问一句话 |
| 内部使用 | Codex 成为 OpenAI 各部门主要 AI 工具;内部周输出 token 占比 99.8%;平均员工超过 85% 输出 token 来自 Codex | 这是前沿组织样本,不等于所有企业现实 |
| 非开发者扩散 | 非开发者个人用户增长 137 倍,组织用户增长 189 倍,OpenAI 内部增长 12 倍 | 扩散重点已经越过程序员 |
| 非技术岗位任务 | 法务、招聘、财务等岗位开始用 Codex 做自动化、数据转换、工具搭建、调试、结构化分析 | 岗位边界被压薄,跨工种能力变便宜 |
这里有两个限制要先说清。
一是 token 占比不是效率指标。一个部门输出 token 多,不代表它省了同等比例的人力,也不代表质量一定更好。
二是 OpenAI 内部不是普通企业。它有更强的工具文化、更高的技术密度,也更愿意把工作流交给新工具。把它直接套到传统企业,会误判落地速度。
但这些限制不削弱主线。恰恰相反,它们让主线更清楚:Codex 的变化不是“更会写代码”,而是能接住更长、更复杂、更接近真实工作的任务。
ChatGPT 更像一个随叫随到的同事,问完就散。Codex 这类智能体更像一个临时执行单元:能读环境,能调用工具,能改文件,能迭代,能在几分钟到几小时里推进一段工作。
工作颗粒度变了,岗位边界就会跟着松。
关键不是替代岗位,而是谁能跨边界调度资源
我更在意的不是 Codex 会不会写代码,而是它让谁能碰原本不属于自己的工作。
过去,一个招聘同事想清洗候选人数据,通常要找数据同事。法务想做文档比对工具,可能要排工程资源。财务想把一堆表格转成结构化流程,也得等人帮忙。
智能体把这层等待磨薄了。
它未必让每个人都变成工程师,但它让更多人可以调动一小段工程能力。这个差别很大。前者是职业身份变化,后者是组织权力变化。
PC 和互联网早期也不是一上来替代某个岗位。它们先改变的是谁能调用资源。会用电子表格的人,可以绕过一部分报表流程;会用网页和搜索的人,可以绕过一部分信息中介。
今天的智能体有点像这段历史的升级版。不同的是,它调用的不只是软件界面,而是一串可执行任务。
“天下熙熙,皆为利来。”落到企业里,就是谁能更快把想法变成流程,谁就更靠近权力中心。
这对科技行业从业者很具体。
开发者不能只把 Codex 当补全工具用。更现实的动作是调整自己的工作流:把需求拆成可验证的小任务,把测试、代码审查、文档生成、数据处理纳入同一条链路。只会写 prompt,不够;不会验收,风险更大。
对企业管理者也很具体。
不要急着把采购 AI 工具当成数字化成果。更该做的是挑一批高频、低风险、可验收的任务先迁移,比如数据转换、内部工具、批量文档处理、报表自动化。审批、权限、日志、责任人也要跟上。否则智能体只会变成一个更贵、更会说话的聊天窗口。
对普通知识工作者,压力点也不是“会不会被 AI 替代”。更近的压力是:原来需要跨部门协作的小任务,别人可能自己做了。你如果只守着岗位说明书,会发现自己的护城河越来越薄。
自动生产力是幻觉,流程重组才是真门槛
我不太买账那种轻飘飘的说法:有了智能体,大家都更高效。
没那么简单。
智能体不是自动生产力。它更像一台需要调度、验收和嵌入流程的机器。任务拆得烂,它会把烂任务跑得更快;验收能力弱,它会把错误包装得更完整;组织流程不改,它就只是多了一个高级入口。
企业真正会赢的地方,不是买了多少 AI 工具,而是能不能改流程。
哪些任务可以并行?哪些审批可以前置?哪些岗位要从执行者变成调度者?哪些输出必须有人复核?这些问题不解决,智能体越强,返工也可能越快。
接下来最该观察三件事。
| 观察点 | 为什么重要 |
|---|---|
| 非技术岗位是否持续增长 | 如果法务、财务、招聘继续高频使用,说明智能体正在进入通用知识工作 |
| 企业是否重写流程,而非只增加工具入口 | 流程不变,效率提升会卡在审批、权限和验收上 |
| 验收责任如何分配 | 智能体能生成结果,但错误、合规和质量责任仍要有人背 |
员工真正会输的地方,也不是“不会提问”。这个说法太浅。
以后更值钱的是三件事:能把模糊目标拆成可执行任务,能判断工具边界,能验收结果质量。
这就是现实分水岭。智能体让低门槛执行变便宜,也让高质量判断更贵。
所以,OpenAI 这篇研究的意义,不是证明 Codex 已经代表全行业。它只是把前沿组织里正在发生的事提前摆出来:知识工作不再按岗位说明书静静分格子,而是按谁能组织一段代理劳动力重新分配。
开头那个 99.8%,不要读成胜利宣言。它更像一声预告。
工具已经进场,接下来要被重新估价的,是人。
