AI 编程争论的要害：速度和可信度要接上同一条反馈回路

核心摘要 Summary

6 月 4 日，Simon Willison 转引了 Charity Majors 的一段判断：软件团队里的 AI 拥护者和怀疑者，可能都没错。

这句话有意思的地方在于，它没有把争论写成“先进”和“保守”的冲突。更真实的场景是，同一个团队里，两派人都想把软件做好，只是盯着两种不同的生存风险。

两种风险都是真的

AI 拥护者看到的是时间压力。

一些团队把 AI 编程工具用得很深后，确实可能出现能力跃迁。原文用的是“真实、非想象、非连续”的提升。这个判断不能被轻轻抹掉。对竞争激烈的团队来说，等尘埃落定再动手，可能已经太慢。

AI 怀疑者看到的是熵增压力。

当代码产出速度超过工程师阅读、理解和审查的速度，团队就在透支一笔多年攒下来的信任账户。代码能跑，不等于系统可维护。上线更快，也不等于值班更轻。

可以把两派看到的东西压成一张表：

角色	看到的现实	害怕的风险	合理动作
AI 拥护者	AI 工具带来真实能力提升，竞争对手可能加速	团队观望太久，错过提效窗口	试点工具、改开发流程、训练团队使用方式
AI 怀疑者	代码生成可能快过人工审查和理解	可靠性下降、知识流失、值班压力加重	加强 review、测试、可观测性和责任边界

这也是我更在意的一点：两派的目标并不冲突。拥护者不是天然不要质量，怀疑者也不是天然反对工具。

冲突发生在风险计量方式不同。一个人拿交付速度说话，另一个人拿返工、故障和维护成本说话。指标不接上，争论就会变成各说各话。

Charity Majors 提到一个关键句：两派之间没有天然反馈回路。

这句话比“要不要用 AI”更重要。因为工具采购很容易，团队共识很难。买一个 AI 编程工具，只需要预算和权限；让团队知道它到底提高了什么、制造了什么债，则需要工程系统自己给出答案。

软件行业以前也见过类似张力。持续集成、DevOps、云原生都把交付速度往前推过。但成熟做法不是只催发布，而是配套测试、回滚、监控和复盘。

AI 编程的麻烦在于，它直接进入代码生产环节。

GitHub Copilot 2021 年面向开发者推出，ChatGPT 在 2022 年 11 月之后让自然语言生成代码变得日常。近两年，Cursor、Claude Code 这类工具又把模型带进更完整的开发流程。

门槛降了，治理要求反而升了。

AI 生成的代码看起来像完成品，但它不会自动带上上下文、责任人和长期维护知识。一个 pull request 能不能合并，不只看测试是否通过，还要看谁理解设计取舍、谁能排障、半年后谁愿意接手。

限制也要讲清楚：目前不能把“用了 AI”直接等同于“系统一定失控”，也不能把“没用 AI”直接等同于“公司会失败”。原文说的是两类可能的生存威胁，不是已经发生的结论。

这件事最直接影响两类人：工程管理者和软件团队技术负责人。

工程管理者要决定节奏。不是全面禁用，也不是全面放开，而是先划试点范围。比如从低风险模块、内部工具、测试代码、文档生成开始，再逐步进入核心链路。

技术负责人要决定门槛。AI 参与生成的代码，不能因为“效率高”就绕过 review、测试、监控和事故复盘。相反，越是生成得快，越要把可理解性写进合并条件。

更实用的观察项可以很简单：

对采购和工具迁移也一样。企业不该只看模型演示和插件热度。更稳妥的做法，是延后大规模铺开，先让一两个团队跑出规则：哪些场景允许用，哪些模块要谨慎，哪些代码必须人工重写或加审查。

开发者个人也会被影响。会用工具当然有价值，但更值钱的是能解释工具产出的代码，能判断哪里要拒绝，哪里要补测试。AI 让写代码变快，也让“读代码、改代码、守系统”的能力更显眼。

接下来要看三件事。

一是团队有没有把 AI 使用纳入工程规范，而不是靠个人习惯。二是组织有没有同时度量速度和维护成本，而不是只报“开发快了”。三是事故和返工能不能反向改变工具使用规则。

回到开头那句话：拥护者和怀疑者可能都没错。错的是让他们在同一个团队里，用两套互不相认的现实工作。

AI 编程真正考验的不是口号，而是组织能不能在加速时保住可信度。