Codex 的真正变化：AI 开始接管一段完整工作

核心摘要 Summary

OpenAI 研究显示，截至 2026 年 5 月，Codex 这类智能体正在从短问短答，转向可委派的长周期任务。
更关键的不是“AI 又提效了”，而是知识工作的边界被压薄：会拆任务、调工具、验结果的人，正在拿到新的组织权力。
对企业管理者和知识工作者来说，接下来要看的不是买不买 AI，而是流程能不能跟着改。

OpenAI 这次讲 Codex，最值得盯的不是模型分数，而是一个有点反常的数字：99.8%。

按 OpenAI 发布的研究，在其公司内部每周输出 token 中，Codex 占到 99.8%。平均员工超过 85% 的输出 token 来自 Codex。工程部门先用，后来法务、招聘、财务也跟上。

这个数字不能读成收入、利润，也不能直接翻译成员工效率。它只能说明一件事：在 OpenAI 这个前沿组织样本里，AI 的使用方式已经变了。人不只是向聊天框要答案，而是在把一段工作交给智能体跑。

Codex 不再只是写代码，而是在吃掉长任务

OpenAI 这篇研究的数据截至 2026 年 5 月。它的价值不在于证明所有公司都已经这样，而在于提前暴露了一个方向：智能体正在从“回答问题”，变成“承接任务”。

观察项	OpenAI 研究中的变化	该怎么读
长周期任务	80.6% 的个人用户至少发起过一次估计超过 30 分钟人工工作量的 Codex 请求；70.2% 超过 1 小时；25.6% 超过 8 小时	用户开始委派完整任务，不只是问一句话
内部使用	Codex 成为 OpenAI 各部门主要 AI 工具；内部周输出 token 占比 99.8%；平均员工超过 85% 输出 token 来自 Codex	这是前沿组织样本，不等于所有企业现实
非开发者扩散	非开发者个人用户增长 137 倍，组织用户增长 189 倍，OpenAI 内部增长 12 倍	扩散重点已经越过程序员
非技术岗位任务	法务、招聘、财务等岗位开始用 Codex 做自动化、数据转换、工具搭建、调试、结构化分析	岗位边界被压薄，跨工种能力变便宜

这里有两个限制要先说清。

一是 token 占比不是效率指标。一个部门输出 token 多，不代表它省了同等比例的人力，也不代表质量一定更好。

二是 OpenAI 内部不是普通企业。它有更强的工具文化、更高的技术密度，也更愿意把工作流交给新工具。把它直接套到传统企业，会误判落地速度。

但这些限制不削弱主线。恰恰相反，它们让主线更清楚：Codex 的变化不是“更会写代码”，而是能接住更长、更复杂、更接近真实工作的任务。

ChatGPT 更像一个随叫随到的同事，问完就散。Codex 这类智能体更像一个临时执行单元：能读环境，能调用工具，能改文件，能迭代，能在几分钟到几小时里推进一段工作。

工作颗粒度变了，岗位边界就会跟着松。

关键不是替代岗位，而是谁能跨边界调度资源

我更在意的不是 Codex 会不会写代码，而是它让谁能碰原本不属于自己的工作。

过去，一个招聘同事想清洗候选人数据，通常要找数据同事。法务想做文档比对工具，可能要排工程资源。财务想把一堆表格转成结构化流程，也得等人帮忙。

智能体把这层等待磨薄了。

它未必让每个人都变成工程师，但它让更多人可以调动一小段工程能力。这个差别很大。前者是职业身份变化，后者是组织权力变化。

PC 和互联网早期也不是一上来替代某个岗位。它们先改变的是谁能调用资源。会用电子表格的人，可以绕过一部分报表流程；会用网页和搜索的人，可以绕过一部分信息中介。

今天的智能体有点像这段历史的升级版。不同的是，它调用的不只是软件界面，而是一串可执行任务。

“天下熙熙，皆为利来。”落到企业里，就是谁能更快把想法变成流程，谁就更靠近权力中心。

这对科技行业从业者很具体。

开发者不能只把 Codex 当补全工具用。更现实的动作是调整自己的工作流：把需求拆成可验证的小任务，把测试、代码审查、文档生成、数据处理纳入同一条链路。只会写 prompt，不够；不会验收，风险更大。

对企业管理者也很具体。

不要急着把采购 AI 工具当成数字化成果。更该做的是挑一批高频、低风险、可验收的任务先迁移，比如数据转换、内部工具、批量文档处理、报表自动化。审批、权限、日志、责任人也要跟上。否则智能体只会变成一个更贵、更会说话的聊天窗口。

对普通知识工作者，压力点也不是“会不会被 AI 替代”。更近的压力是：原来需要跨部门协作的小任务，别人可能自己做了。你如果只守着岗位说明书，会发现自己的护城河越来越薄。

自动生产力是幻觉，流程重组才是真门槛

我不太买账那种轻飘飘的说法：有了智能体，大家都更高效。

没那么简单。

智能体不是自动生产力。它更像一台需要调度、验收和嵌入流程的机器。任务拆得烂，它会把烂任务跑得更快；验收能力弱，它会把错误包装得更完整；组织流程不改，它就只是多了一个高级入口。

企业真正会赢的地方，不是买了多少 AI 工具，而是能不能改流程。

哪些任务可以并行？哪些审批可以前置？哪些岗位要从执行者变成调度者？哪些输出必须有人复核？这些问题不解决，智能体越强，返工也可能越快。

接下来最该观察三件事。

观察点	为什么重要
非技术岗位是否持续增长	如果法务、财务、招聘继续高频使用，说明智能体正在进入通用知识工作
企业是否重写流程，而非只增加工具入口	流程不变，效率提升会卡在审批、权限和验收上
验收责任如何分配	智能体能生成结果，但错误、合规和质量责任仍要有人背

员工真正会输的地方，也不是“不会提问”。这个说法太浅。

以后更值钱的是三件事：能把模糊目标拆成可执行任务，能判断工具边界，能验收结果质量。

这就是现实分水岭。智能体让低门槛执行变便宜，也让高质量判断更贵。

所以，OpenAI 这篇研究的意义，不是证明 Codex 已经代表全行业。它只是把前沿组织里正在发生的事提前摆出来：知识工作不再按岗位说明书静静分格子，而是按谁能组织一段代理劳动力重新分配。

开头那个 99.8%，不要读成胜利宣言。它更像一声预告。

工具已经进场，接下来要被重新估价的，是人。

Codex 的真正变化：AI 开始接管一段完整工作

Codex转向

长任务化

使用样本

数据边界

边界压薄

扩散越界

权力变化

流程门槛

任务迁移

治理跟进

能力重估

提示降权

验收升值

Codex 不再只是写代码，而是在吃掉长任务

关键不是替代岗位，而是谁能跨边界调度资源

自动生产力是幻觉，流程重组才是真门槛