一个开发者用 AI 做了很多东西。
Rust 语音识别、邮件归档工具、Jellyfin 桌面克隆、Invidious 克隆、Windows 95 记事本复刻、交通流量识别、区域新闻站、3D 赛车游戏、投资回测、Lightroom UI 克隆、世界时钟小组件、摄像头客户端,一个不小的 Rust SaaS,还有几十个已经删掉的项目。
听起来像生产力神话。
他的复盘却很冷:除了 SaaS,几乎都没用,也不想维护。那个区域新闻站甚至真有流量,结果变成一个“意外经营的新闻媒体”,更像负债。
这篇博客刺到人的地方,不是又有人夸 AI 编程,也不是又有人骂 AI。它讲的是一个更接近重度用户日常的问题:当生成成本低到接近零,开发者会不会从解决问题,滑向制造项目库存?
发生了什么:能做很多,不等于做成一件事
作者不是 AI 编程轻度尝鲜者。他长期使用 Claude 和 Codex,也承认这些工具很强。
Codex CLI 更快。Claude 能在冷门语法、冷门语言里零样本写 parser 和测试。明确、窄小、可验证的任务,AI 确实能省下大量时间。
问题出在任务边界被冲淡之后。
| 项目类型 | AI 带来的表面收益 | 后来的真实成本 |
|---|---|---|
| Rust 语音识别、parser、测试 | 快速产出代码,适合明确任务 | 只解决局部问题,不自动变成长期成果 |
| 新闻站、SaaS、游戏 | 原型速度很快,反馈很爽 | 维护、运营、迭代责任跟不上 |
| Jellyfin、Invidious、Lightroom 等克隆工具 | 很容易做出“像样”的东西 | 多数没有真正需求,也没人愿意长期管 |
| 各类脚本、小组件、摄像头客户端 | 低成本满足一时冲动 | 原问题未必解决,新目录和新债务变多 |
这就是反常点。
AI 明明让代码更容易写,结果项目质量未必更高。它把“开始做”的门槛打掉了,却没有帮你承担“做下去”的责任。
对开发者来说,最直接的后果是注意力漂移。一次会话从“帮我写个小脚本”开始,一小时后,东西已经变成新项目。原来的痒点还在,仓库却多了一个。
对技术管理者来说,风险更隐蔽。团队看起来更忙,原型更多,PR 更多,演示更多。但如果维护人、业务目标、砍项目机制都没跟上,这些产出只是把未来的清理成本提前赊出来。
为什么重要:AI 工具的激励,不鼓励你停下来
我更在意的是工具背后的激励。
多数 AI 编程产品并不靠“让你少用”证明价值。它们更容易被更多 token、更多输出、更多 follow-up、更多 agent 回合证明有效。
你问一个简单问题,产品顺手给你下一步。你想修一个函数,它建议你重构模块。你只想止痒,它递给你一个新项目的开头。
这不是阴谋论,是商业常识。
“天下熙熙,皆为利来。”放到 AI 工具上,就是用量会被自然包装成价值。厂商希望你多用,产品设计也会鼓励你继续问、继续生成、继续扩展。
这和 Cal Newport 说的“伪生产力”很贴近。数字工具让单个任务更快,却可能让人更忙、更碎、更远离深度工作。邮件更快,不等于沟通更好;代码更快,不等于产品更真。
AI 编程的危险在于,它给的是便宜奖励。
几分钟吐出上千行代码,看上去像进展。可维护成本、测试责任、产品判断、用户反馈,都没有被模型一起生成出来。
这和早期 PC、网页工具、低代码平台有一点像,但不完全一样。那些工具也降低了创造门槛,带来大量小软件、小网站、小系统。区别是,AI 把“从想法到可运行”的距离压得更短,短到人还没来得及做取舍,东西已经跑起来了。
跑起来,不等于值得存在。
所以我不太买账那种只看效率曲线的说法。AI 编程当然能提效,但提效对象必须说清楚:是提高解决关键问题的速度,还是提高制造半成品的速度?这两件事差很远。
谁该调整:重度用户限用,管理者改指标
取消订阅不是普适药方。对很多人来说,AI 编程仍然是好工具。
写测试、补 parser、生成样板代码、探索陌生 API、做一次性脚本,这些场景很适合它。边界清楚,验收也清楚。
但对重度用户,尤其是那种每天打开 Claude、Codex、Cursor 就开始开新坑的人,限用可能是必要动作。
可以很具体:
- 给 AI 使用设一个时间窗,而不是全天随手开。
- 新项目必须写一句“要解决的真实问题”,写不出就不建仓库。
- 原型超过一天,就补维护人、退出条件和删除条件。
- 每周清一次 AI 生成项目,只留下愿意负责的。
这不是反技术,而是把摩擦放回工作流。
摩擦过去常被视为低效。可在创造性工作里,摩擦也是筛选器。手写没有过时,长文不能只是口语转录,产品也不能只是提示词的副产品。
技术管理者更该改指标。
如果团队引入 AI 工具,只盯“代码提交更多”“原型更多”“响应更快”,很容易被浅层活动骗过去。更该问三件事:瓶颈解决了吗?维护责任明确了吗?有没有项目被及时砍掉?
接下来最该观察的变量也在这里。
不是模型又快了多少,也不是上下文窗口又长了多少。真正该看的是:AI 生成的项目,有多少进入长期维护;团队是否建立了砍项目机制;开发者是否愿意为生成出来的东西负责。
如果这些变量没有改善,模型越强,项目库存越厚。一个人终于可以做出很多东西,却更难确认哪一个值得做下去。
开头那串项目清单,最刺眼的不是数量,而是反差。代码变便宜了,承诺没有变便宜。模型看着更强,工作反而可能更虚。
