OpenAI 发布 GPT-5.5。它已经进入 OpenAI Codex,并向付费 ChatGPT 用户滚动开放。官方 API 还没来。OpenAI 的说法是,API 部署需要不同的安全和安全性要求,GPT-5.5 与 GPT-5.5 Pro 会“很快”进入 API。
Simon Willison 抓住了这个空档。他通过 Codex 使用的 /backend-api/codex/responses 路径,写了 llm-openai-via-codex 插件,让用户用现有 Codex / ChatGPT 订阅,在 LLM 命令行工具里调用 openai-codex/gpt-5.5。这不是正式公开 API。更准确地说,它是 Codex 专用、被公开表态支持、但尚未文档化成通用 API 的订阅通道。
GPT-5.5 的发布重点:订阅先行,API 在后
这次新闻不复杂。复杂的是顺序。
| 事项 | 当前状态 | 对开发者的影响 |
|---|---|---|
| GPT-5.5 | Codex 已可用,付费 ChatGPT 滚动开放 | 订阅用户先拿到新模型 |
| 官方 API | 暂未开放,官方称“很快” | 生产接入、成本评估、合规评审只能等 |
| Codex 通道 | 使用 /backend-api/codex/responses | 可跑,但不是正式公开 API |
llm-openai-via-codex | 接入现有订阅,在 LLM CLI 调用 GPT-5.5 | 工具链作者多了一条路,也多了一层不确定性 |
这条 Codex 路径并非纯民间硬闯。OpenAI 的 Romain Huet 曾公开表示,希望用户能在应用、终端、JetBrains、Xcode、OpenCode、Pi、Claude Code 等环境里使用 Codex 和 ChatGPT 订阅。Peter Steinberger 也回应称,OpenAI 订阅集成是受支持的。
但“受支持”还不是“稳定、公开、可长期依赖”。目前能看到的证据主要是公开推文、开源 Codex 相关实现,以及实际可用性。企业采购、SaaS 后端、Agent 平台如果要把它放进生产链路,仍然缺一份更硬的东西:正式文档、服务等级、限额规则、条款边界。
这正好和 Anthropic 封堵 OpenClaw 接入 Claude 订阅形成对照。Anthropic 关门,OpenAI 开缝。开缝当然更友好,但缝不是门。门有门牌、合同和逃生通道;缝只有今天能不能钻过去。
“天下熙熙,皆为利来。”这句放在这里很合适。模型公司争的不是一句提示词的归属,而是谁控制入口、计费、限流和解释权。
鹈鹕测试看能力,也看成本
Willison 用他常跑的“鹈鹕骑自行车”SVG 测试 GPT-5.5。这个测试不能当严格基准。它更像一个轻量探针:看模型能不能同时处理图形代码、空间关系、部件约束和审美细节。
默认输出一般。喙还行,身体和车架不太稳。腿至少踩到了踏板,但整体结构谈不上漂亮。
把 reasoning_effort 调到 xhigh 后,结果明显更好。SVG 更依赖 CSS 和渐变,鹈鹕身体更完整,自行车也更接近正常形状。
代价很硬:接近 4 分钟,reasoning tokens 从 39 飙到 9322。
| 模式 | 输出表现 | 成本信号 |
|---|---|---|
| 默认 | 可用但粗糙,车架和身体结构一般 | 39 reasoning tokens |
xhigh | 结构更完整,细节更好,使用更多 CSS / 渐变 | 9322 reasoning tokens,耗时近 4 分钟 |
这说明 GPT-5.5 的能力不是免费升级。它更像一辆马力更大的车。你能踩油门,但油耗、延迟和用户耐心一起扣账。
Ethan Mollick 的评测也给了一个冷水提醒:GPT-5.5 仍处在所谓“锯齿边界”里。它在一些任务上很强,在另一些任务上仍会失手。别把它当成 GPT-5.4 的全面碾压版。更稳妥的用法,是把它放到高价值、可容忍延迟、能承受试错成本的任务里。
对 AI 开发团队来说,动作应该很具体:别急着把默认模型全切到 GPT-5.5。先挑 5 到 10 个高价值任务做 A/B,对比成功率、延迟、token 消耗和人工返工率。工具链作者也别把 Codex 通道写死成唯一入口。至少保留官方 API、旧模型和本地配置回退。
涨价不是尾注,是平台策略
GPT-5.5 API 上线后,价格将是 GPT-5.4 的两倍:输入 $5 / 百万 tokens,输出 $30 / 百万 tokens。GPT-5.5 Pro 更贵:输入 $30 / 百万 tokens,输出 $180 / 百万 tokens。GPT-5.4 会继续保留。
| 模型 | 输入价格 | 输出价格 | 更适合的场景 |
|---|---|---|---|
| GPT-5.4 | $2.5 / 百万 tokens | $15 / 百万 tokens | 日常吞吐、成本敏感任务 |
| GPT-5.5 | $5 / 百万 tokens | $30 / 百万 tokens | 更难任务、代码与推理增强场景 |
| GPT-5.5 Pro | $30 / 百万 tokens | $180 / 百万 tokens | 少量高价值任务,不适合无脑默认调用 |
这套分层很像 Claude Sonnet 和 Claude Opus 的关系:便宜模型跑大盘,贵模型打硬仗。区别在于,GPT-5.5 这次还叠加了 API 缺席和 Codex 订阅通道先行。
开发者真正要算的不是“新模型强不强”。要算的是三笔账。
- 成本账.输出价格翻倍后,长上下文、代码生成、Agent 多轮调用都会变贵。
- 稳定账.Codex 通道可用,但不是正式公开 API,限流和条款边界仍需谨慎。
- 迁移账.如果团队先按订阅通道适配,等官方 API 上线后,鉴权、计费、响应格式和策略限制可能还要再核一遍。
这也是 OpenAI 这次真正聪明的地方。它没有像 Anthropic 那样直接把门关上,而是让工具生态先活起来。开发者会觉得它开放,用户会觉得订阅更值,Codex 也会变成更重要的入口。
代价是控制权回到了平台手里。API 晚一点,订阅先跑起来,第三方工具先接入,但关键阀门仍在 OpenAI 这一侧。铁路时代也有类似逻辑:谁铺轨不重要,谁定轨距、收过路费、管调度,谁才握着系统的命门。今天的轨道换成模型接口、token 计费和账号权限。
接下来该盯三件事,不用盯口号。
- 官方 API 何时上线价格和限制是否与发布页一致。
/backend-api/codex/responses这类 Codex 通道是否会被正式文档化还是继续停留在半官方状态。- 订阅调用和 API 调用会不会被分成两套世界不同限额、不同审计、不同稳定性、不同可商用边界。
对企业团队,我会建议延后大规模采购决策,等 API 正式开放后再压测。对个人开发者和工具作者,可以试,但要把它当实验入口,不要当基础设施。今天能跑,不等于明天能扛生产。
