Cloudflare 这次补的不是新模型,也不是完整实验平台,而是一个工程团队每天都会碰到的东西:Flagship,feature flag 服务。

它解决的问题很朴素:代码不用重新部署,也能控制某个功能对谁可见、放给多少用户、下发什么配置。上线之后有刹车,比上线本身更值钱。

对已经在用 Workers 的团队,这不是多一个菜单。它意味着灰度、配置、边缘运行时开始被拧到同一条发布链路上。省事是真的,粘性也是真的。

Flagship 做的是发布控制,不是实验分析

按 Cloudflare 文档,Flagship 现在能覆盖几类基础能力。

能力文档里能看到的做法对团队的意义
Feature flag控制功能可见性不重新部署,也能开关功能
Targeting rules按用户属性下发不同值,支持比较操作、AND/OR、顺序评估做分群灰度,不必全量硬上
Percentage rollouts按百分比逐步放量,使用一致性哈希同一用户稳定拿到同一结果
Multi-type variations支持 boolean、string、number、JSON object不只开关,也能下发配置块

它和 Workers 绑得很近。开发者可以通过原生 Workers binding,在 Worker 里直接评估 flag。文档也强调了类型安全方法,以及默认 fallback。

它也兼容 CNCF OpenFeature。通过 @cloudflare/flagship SDK,flag 评估可以跑在 Workers、Node.js 或浏览器里。Cloudflare 的说法是,切换 provider 只需要改配置。

底层分发用的是 Cloudflare KV 基础设施。管理侧则通过 Cloudflare dashboard 创建、更新、删除 flag,并把 flag 组织进 app,对应项目或服务。

边界也要说清。

目前材料能证明的是 feature flag、定向、百分比 rollout、多类型 variation 和配置分发。它不能被直接写成完整 A/B 测试分析产品。实验统计、指标归因、商业分析,这些信息现在看不到。

这也不是行业首创。Feature flag 是成熟赛道。Cloudflare 的新意在位置:它把这件事放到边缘运行时和开发者平台里。

谁受影响:Workers 团队最先动,灰度团队要重新算账

最直接受影响的是两类人。

一类是 Cloudflare Workers 开发者。如果服务已经跑在 Workers 上,Flagship 会让灰度发布和配置下发更顺手。请求进边缘节点时就能评估 flag,少接一套外部系统,少维护一段调用链。

这类团队可以做的动作很具体:新功能灰度、地区策略、用户分群、轻量配置下发,可以先放到 Flagship 里试。尤其是前端、轻后端、边缘 API,收益更直接。

另一类是负责灰度发布和配置管理的工程团队。对他们来说,问题不是“要不要 feature flag”。问题是发布控制应该放在哪里。

路线好处现实约束
用 Cloudflare Flagship和 Workers、KV、dashboard 更贴近,边缘场景更顺更依赖 Cloudflare 的运行时、管理界面和发布流程
继续用独立 feature flag 服务平台中立性更强,跨云、跨运行时更自然需要维护额外集成,边缘链路可能更绕
自建配置/灰度系统控制权更完整运维、权限、审计、稳定性都要自己扛

所以,已经重度使用 Workers 的团队,可以更积极地评估 Flagship。它补的是发布基础设施。

还在选型的团队,最好先慢一点。不是因为 Flagship 不好,而是要把迁移成本算完整:运行时、配置数据、权限体系、dashboard 操作习惯、发布流程,都会变成后续成本。

负责采购或平台选型的人,至少该延后“一刀切迁移”的决定。可以先把低风险项目放进去,看团队使用成本和治理边界,再决定要不要扩大。

真正的看点:OpenFeature 降焦虑,平台集成造粘性

我更在意的不是 Cloudflare 又补了一个开发者工具,而是它把“发布”这件事继续平台化。

过去很多团队的发布控制分散在几处:代码仓库、CI/CD、配置中心、灰度系统、监控告警。Cloudflare 的路线更直接:运行时、数据面、配置分发、灰度评估,尽量压到同一个边缘平台。

对开发者,这是少接几套系统。对平台,这是多拿住一段关键链路。

方便当然是真的。

如果你的服务本来就在 Workers 上,flag 评估离用户更近,工程体验会变好。灰度发布、地区策略、用户分群、配置块下发,都能在同一套 Cloudflare 体系里完成。

但别把 OpenFeature 误读成完全自由。

OpenFeature 解决的是代码接口层的可迁移性。业务代码不必写死在某一家 feature flag 厂商 API 上,这是好事。

真正的迁移成本不只在 SDK。它还在运行时、KV 分发、权限模型、dashboard、团队流程,以及事故处理习惯里。

“天下熙熙,皆为利来。”放到云平台里,就是开发者要效率,平台要控制面。双方都合理,问题是别只看效率,不看控制权。

这件事像早期云厂商把数据库、日志、队列、函数计算一层层做进平台。不完全一样,但逻辑相近:每一个基础设施都在降低开发成本,也在增加离开的摩擦。

Flagship 的分水岭不在“有没有 feature flag”。大家都有。分水岭在于,谁能把发布控制放到最靠近用户、最靠近运行时的位置。

接下来最该观察的不是口号,而是几个硬变量:价格怎么定,权限和审计怎么做,大规模配置分发的限制是什么,和现有 feature flag 服务相比迁移成本有多高。

这些没看清之前,Flagship 更适合被当成 Workers 平台能力来评估,而不是替代所有灰度系统的答案。

Cloudflare 这次做对了一件很实用的事。只是越实用的基础设施,越容易变成路径依赖。工具最有力的时候,往往不是让你惊叹,而是让你懒得离开。