当 AI 代理开始碰公司文件,Relay 想先给它装上“刹车”和“行车记录仪”

AI 代理很性感,但企业真正关心的是“出事了谁负责”
这两年,AI 行业最热闹的故事,已经从“聊天机器人会不会写诗”走到了“代理会不会替你把活干完”。从 Claude 的各种工作流能力,到 OpenAI、微软、Google 不断补齐自动执行、连接外部工具、调用文件和日程的能力,大家都在把大模型从一个回答问题的盒子,推向一个可以接任务、会拆步骤、能自己跑流程的“数字同事”。
但企业一旦真的要把这位“数字同事”请进公司,问题马上就不再浪漫了。它能不能接触内部文件?能不能删东西?能不能调用 shell?它把数据送到哪儿去了?一旦做错了,日志在哪儿?谁批准的?这不是产品经理在发布会上能用几张炫酷幻灯片带过去的问题,而是金融、医疗、法律、政务这些行业每天都要面对的现实。说得直白一点:AI 代理最难跨过去的门槛,不是智能,而是治理。
SeventeenLabs 刚刚开源的 Relay,切中的就是这个缝隙。官方给它的定位很直接:如果 OpenClaw 是运行时,Relay 就是本地“指挥台”。它想复刻 Claude Cowork 那类体验——自主执行任务、调度、子代理、连接 Slack、Notion、GitHub、Jira——但把控制权拿回用户自己的基础设施里。这个方向听起来不那么炸裂,却非常现实:在今天的企业环境里,很多公司不是不想用代理,而是不敢把代理直接放出去乱跑。
Relay 不是又一个聊天框,它更像 AI 时代的“值班室”
看完项目介绍,我最大的感受是:Relay 的野心并不是做一个更好看的 AI 桌面应用,而是把“代理执行”这件事拆成了两个层面。前面是控制平面,也就是 Relay 这个 Electron 桌面应用;后面是执行平面,也就是 OpenClaw 运行时。前者负责你看见什么、批准什么、怎么配置;后者负责代理真正去跑任务、记忆上下文、调工具、调用模型、读写文件。
这种架构的妙处,在于它把“自动化”与“主权”放到了一起。Relay 支持的关键能力包括高风险操作审批、可导出的完整审计记录、任务级成本追踪、持续调度,以及连接不同模型后端。换句话说,它希望把现在大家对 AI 代理最担心的几个点——数据出境、模型锁定、合规留痕、成本失控——一起打包处理掉。你可以把它理解成:给 AI 代理装上审批流、黑匣子和费用报表。
这也解释了 Relay 为什么反复强调自己不是 Telegram、Discord、Slack 机器人那一路产品。聊天应用当然也能接代理,你发一句话,它回一句,看上去很轻巧。但一旦代理开始调用 shell、导出数据、批量读写文件,聊天窗口的“轻巧”就会变成管理灾难。你只看到结果,却看不到过程;你能收到回复,却没有一条适合审计的执行轨迹。很多团队正是在这里摔跤:做 demo 的时候,聊天式代理非常顺滑;到了要上生产环境,大家突然发现自己根本没有方向盘。
为什么它偏偏在这个时间点显得重要
Relay 的出现,背后其实是一个越来越清楚的行业趋势:AI 工具正在从“云上订阅服务”转向“可治理的本地或自托管基础设施”。尤其是当企业开始认真讨论 GDPR、HIPAA、内部安全制度,乃至各类审计要求时,问题已经不是模型够不够强,而是整个系统链路有没有留下标准化痕迹。Anthropic 自己也承认,Claude Cowork 目前并不适合强监管流程,因为相关活动尚未进入标准审计日志或合规 API。这个表态非常坦诚,也间接说明了市场空白在哪里。
Relay 的策略有点像把“Copilot 时刻”往企业内网里搬。过去几年,GitHub Copilot、Microsoft 365 Copilot 教会企业一件事:AI 可以提升效率,但前提是它必须嵌入现有的工作流和权限体系。现在代理化浪潮更进一步,AI 不只是建议你按哪个按钮,而是可能直接替你按下去。这个时候,审批门、责任链、可追溯性就不再是加分项,而是准入门票。
还有一个现实因素是成本。越来越多团队发现,顶级闭源模型确实好用,但如果让代理长时间运行、频繁调用工具、多轮规划,token 消耗会非常吓人。Relay 通过 OpenClaw 把模型路由交还给用户:Claude、GPT-4、Llama、Gemini、Mixtral 甚至自定义端点都可以接入。这个设计未必意味着“便宜一定赢”,但至少把选择权留给企业自己。某些高价值任务用最强模型,批量分析和日常巡检用开源模型,这种分层策略,才更像成熟 IT 部门会做的事。
它的亮点很清楚,短板也同样明显
如果站在记者的角度评价,Relay 最有意思的地方,不在于它提出了多新鲜的 AI 能力,而在于它把企业最讨厌的风险,翻译成了产品界面里的具体机制。比如高风险动作暂停审批,文件删除、shell 命令、数据发送前都要有人点头;比如完整时间线,记录每个动作、理由、批准记录和成本;再比如调度和长期运行,让代理可以待在 VPS 上 24 小时值班,而不是开个浏览器标签页,关机就一起下线。这些东西不性感,但真正能决定一个产品能不能进入企业采购名单。
不过,Relay 也不是没有门槛。它依赖 OpenClaw 生态,本质上更像是给已经愿意折腾自托管代理的团队准备的“操作台”。如果你只是个人用户,想在云端用一个现成的 Claude 工具提高效率,那它多半会显得有点重。项目自己也很坦率:如果你对 Claude-only 没意见,也不在意数据上云,那直接用 Cowork 可能更省心。很多开源项目都喜欢把自己包装成“适合所有人”,Relay 反而把适用边界说得很清楚,这点我挺喜欢。
更值得讨论的是,治理会不会拖慢代理的效率?这是一个经典矛盾。审批越细,风险越低,但自动化体验也越碎;审计越完整,企业越安心,但系统复杂度和部署成本也越高。某种程度上,Relay 正在试图证明:企业不需要完全放权给 AI,也能获得代理的价值。可这条路是否足够顺滑,还要看它能不能把审批和操作体验做得足够自然,不然用户很容易回到“算了,还是我自己来”的老路上。
开源世界正在补上 AI 代理的最后一块拼图
从更大的产业视角看,Relay 代表的是开源 AI 基础设施的一次成熟化尝试。前几年,开源社区忙着追模型能力;再后来,大家补工具调用、记忆、向量库、RAG、工作流编排;而现在,终于有人开始认真做“治理层”。这恰恰说明行业正在从玩具阶段进入可落地阶段。会跑任务的代理不少,能让法务、安全、审计部门勉强点头的代理生态,还非常少。
这让我想起云计算早期的一段历史。最初大家只看到弹性和便宜,后来才明白,权限管理、监控、审计、日志、灾备这些“看起来不够酷”的能力,才是企业大规模采用云服务的真正基础。AI 代理今天也在经历类似阶段。下一波竞争,不只是模型排行榜上的几分差距,而是谁能把代理从“实验室里的聪明助手”,变成“组织里的可靠流程节点”。
所以,Relay 这类项目真正抛出的追问是:未来的 AI 代理,究竟应该像一个自由发挥的实习生,还是一个每一步都可追责的企业系统组件?我的判断偏向后者。至少在企业市场,没人会愿意让一个连日志都说不清的代理,直接碰自己的财务报表、客户邮件和生产代码库。
如果 Relay 能继续把 OpenClaw 生态、模型路由、审计导出和审批体验打磨好,它未必会成为大众最熟悉的 AI 产品,却很可能成为企业内部最容易活下来的那一类工具。它不负责制造惊呼,它负责让人敢用。对今天的 AI 行业来说,这反而是一种稀缺能力。