Claude Code 上线“Routines”:AI 代码助手开始学会自己上夜班了

开发工具 2026年4月15日
Claude Code 上线“Routines”:AI 代码助手开始学会自己上夜班了
Anthropic 正在把 Claude Code 从“会写代码的聊天窗口”,推进成一个能自动值班、自动巡检、自动提 PR 的云端代理系统。Routines 的真正意义不在于定时任务本身,而在于它把代码仓库、外部工具和触发机制绑成了一个持续运行的 AI 工作流,这对开发者协作方式可能是一次不小的改写。

Anthropic 最近给 Claude Code 加了一项很有意思的新能力:Routines。名字听起来平平无奇,像是日历 App 里那个每天提醒你喝水的功能,但它干的事显然更野心勃勃——把一段提示词、一个或多个代码仓库、外部连接器,以及触发条件打包成一个“自动执行的 AI 工作单元”,然后丢到云端去跑。电脑合上了,程序员下班了,它还在继续干活。

这不是一句“支持自动化”就能带过的小更新。过去一年,AI 编程工具最常见的形态是副驾驶:你写一行,它补一行;你提个问,它给个答案。Anthropic 这次想做的,显然不是副驾驶,而更像是给工程团队配了一个不会睡觉、能接 GitHub 事件、能接 API 告警、还能按周定时巡逻的“远程工程助理”。

从聊天助手到“云端打工人”

按照官方文档的定义,Routine 本质上是一份保存好的 Claude Code 配置。它包含提示词、仓库、运行环境、连接器,以及触发器。关键不在“保存配置”,关键在“自动运行”。它运行在 Anthropic 托管的云基础设施上,这意味着它不依赖本地电脑,不需要你保持终端开着,更不需要一边吃晚饭一边担心脚本是不是挂了。

它支持三类触发方式:定时触发、API 触发和 GitHub 触发。单看这三个词,你会觉得它像 Zapier、GitHub Actions 和传统 cron job 的混合体;但再往里看,它又不完全一样。因为触发后干活的不是一个预先写死的脚本,而是一个 Claude Code 会话。这个会话能读代码仓库、跑 shell 命令、调用连接器,还能基于提示词做相对开放式的判断。

这就是有意思的地方。传统自动化擅长明确流程:输入 A,执行 B,产出 C。AI agent 型自动化擅长处理那些“结构不那么整齐、但目标很明确”的工作,比如代码审查、文档漂移检查、故障告警归因、跨语言 SDK 同步。这些任务以前也能自动化,但往往要为每一种场景单独写大量胶水代码。现在 Anthropic 的卖点是:你不用再先造一个复杂系统,只要把边界给清楚,把权限给够,再把提示词写明白,它就能先干起来。

它为什么会在这个时间点出现

如果把时间线拉长一点看,这次更新其实很符合当下 AI 编程产品的演化方向。

2023 年,行业还在兴奋地讨论“AI 能不能帮你补全函数”;2024 年,大家开始卷“能不能看懂整个仓库”;到了 2025 年,一个更实际的问题摆上桌面:AI 不只要会回答,还要会持续执行。 也就是说,企业真正愿意为之买单的,不是“一个更聪明的聊天框”,而是“一个能接入现有软件开发流程、并且在没人盯着时也能稳定工作的自动化劳动力”。

Anthropic 的 Routines 明显踩在这条线上。它不是单纯和 GitHub Copilot 拼补全速度,也不是和 Cursor 拼 IDE 里的交互体验,而是在往“开发流程自动化平台”方向走。你可以把它理解成 Claude Code 版本的 agent 编排能力,只不过界面和包装更偏产品化,离普通团队更近一些。

这和 OpenAI、GitHub、Google 近来的动作也形成了某种呼应。大家都在从“模型能力”转向“工作流能力”。模型本身再强,如果不能可靠地嵌入真实组织的日常流程,最终还是停留在演示层。Routines 的出现,说明 Anthropic 也不想只做那个在终端里回答问题的模型提供商,它想吃到更上层、更接近业务结果的一块蛋糕。

最迷人的地方:它不是替你写代码,而是替你处理“烦人的边角活”

文档里给了几个示例,我觉得最能说明问题的,不是“AI 可以自动审 PR”这种已经有些耳熟的场景,而是那些开发团队每天都会碰到、却又不太值得工程师花精力亲自做的工作。

比如 backlog maintenance。每周固定时间,Routine 去看新开的 issue,帮你打标签、按代码区域分配负责人、再把摘要发到 Slack。这个动作并不性感,但团队里谁都知道,它真的很耗精力。又比如 docs drift,代码改了、接口变了、文档还停在旧版本。Routine 每周扫一遍合并过的 PR,把可能过期的文档挑出来,甚至直接开一个更新 PR 给编辑审。

再比如 deploy verification 和 alert triage,这就更接近“AI 值班工程师”了。生产环境部署完,CD 流程可以直接调它的 API,让它去做冒烟测试、扫日志、判断是继续放行还是赶紧喊停。监控系统出现错误峰值,也可以把告警正文通过 API 发给 Routine,它自己去拉堆栈、比对最近提交,甚至直接开草稿 PR。值班工程师不再从一个空白终端开始排查,而是从一份已经写好上下文和修复建议的草稿开始判断。这节省的不只是时间,更是注意力。

说白了,Anthropic 盯上的不是“核心编码”这块最容易引发英雄主义想象的工作,而是软件团队里那些不断消耗耐心、又充满流程性的外围劳动。这个判断很聪明。因为真正先被 AI 大规模吃掉的,往往不是最复杂、最有创造性的部分,而是那些高频、重复、带一点判断、但又不需要太多组织政治的任务。

但别高兴得太早:自动化越聪明,权限问题越扎手

Routines 的另一面,是它把一个 AI 会话放进了真实生产流程,而且这个会话默认可以跑 shell、读写仓库、调用外部连接器。文档也说得很明白:Routine 运行时没有权限确认弹窗,也没有审批模式选择,它是自主执行的。你授予它哪些仓库、哪些网络权限、哪些连接器,它就会直接用。

这当然是效率来源,但也是风险来源。

尤其是它使用的是你的身份。它通过 GitHub 做的提交、发起的 PR,会挂你的 GitHub 用户;通过 Slack、Linear 等连接器发出的消息和动作,也会以你的账户名义出现。这个设计很务实,因为企业里很多系统必须绑定到真实身份;但也正因为如此,审计、问责、误操作边界都会变得更加敏感。一个写错提示词的 Routine,和一个拿着你工牌到处刷门禁的实习生,后果上可能没那么大差别。

Anthropic 也做了一些约束,比如默认只能推送到 claude/ 前缀分支,避免 Routine 直接改主干;比如每个 API trigger 都有独立 token,可以单独吊销;比如 GitHub 触发可以加过滤条件,只让特定 PR 或特定分支触发。但说到底,这依然是一个高权限自动化系统。它很适合那些已经有一定工程治理能力的团队,却不见得适合“先开权限再说”的草台班子。

这里有一个我觉得行业接下来必须面对的问题:当 AI agent 开始以“员工身份”行动时,我们到底该如何定义它的操作责任? 如果它误发了一条 Slack 公告、错误关闭了一个 issue、或者提交了有问题的修复 PR,责任是模型、是配置者、还是平台?以前自动化脚本出了错,至少还能说“脚本逻辑写死了”;现在 agent 有一定开放式决策能力,责任边界会更模糊。

它会不会成为下一代开发工具的标配?

我的判断是,大概率会,而且不只是 Anthropic 会做。

原因很简单:开发团队已经不满足于“让 AI 帮我写”,他们开始要求“让 AI 自己去做一部分流程”。从代码审查到文档同步,从告警分类到版本回归检查,所有这些流程一旦被产品化,就会迅速从“高级玩法”变成“团队标配”。今天看起来像新鲜能力,明天可能就会像 CI/CD 一样,成为工程基础设施的一部分。

不过,谁能跑到前面,不只看模型聪不聪明,还看平台整合能力强不强。Anthropic 这次把仓库、环境、连接器、触发器、运行记录放进了一个统一入口,方向是对的。但它仍然有一些明显限制,比如 API 和 GitHub 触发主要依赖 Web 端配置,CLI 管理体验还不够完整;又比如 Routine 是个人账号维度,而不是团队共享资产,这对企业协作来说多少有点别扭。一个真正成熟的企业级自动化代理系统,最终应该具备更强的团队治理、权限分层、审计与回滚能力。

即便如此,这依然是一项值得认真看的更新。因为它再次提醒我们,AI 编程的竞争,不会停留在谁补全得更快、谁生成的函数更漂亮。真正的下一战,是谁能让 AI 更自然地嵌入软件开发的流水线,替人类接住那些没人想做、但又总得有人做的活儿。

程序员当然不会因为一个 Routine 就失业。但你团队里那个每天早上要先看告警、再清 issue、还得追文档更新的人,可能很快就会发现:有些夜班,真的可以交给 AI 去上了。

Summary: Claude Code 的 Routines 不是一个简单的“定时任务”功能,而是 Anthropic 向 AI agent 工作流迈出的更实用一步。它最有价值的地方,在于开始接管开发流程里那些重复、琐碎、却真实消耗团队精力的工作。我的判断是,这类“可触发、可审计、可接入仓库和外部系统”的 AI 自动化能力,会在未来一年成为主流开发平台的标配;真正拉开差距的,将是权限治理和组织级协作能力,而不只是模型本身有多聪明。
Claude CodeRoutinesAnthropicAI代码助手自动化工作流代码仓库GitHub事件触发云端代理系统PR自动提交连接器