GPT-5.5 开放 API 后,OpenAI 没有只讲新模型。它先提醒开发者:别把 GPT-5.5 当成 GPT-5.2 或 GPT-5.4 的 drop-in replacement。
这比“又发了一个模型”更值得看。因为它戳中了一件很多团队不愿承认的事:过去攒下来的 prompt、工具描述、输出格式、兜底规则,未必能顺着新模型继续跑。
换模型,不是改一个 model string。更像铁路换轨距。车头更强,旧轨道也要重新量一遍。
这次更新,开发者先看四件事
OpenAI 这次给的是一套迁移提醒,不是单纯的产品发布页。信息很短,但指向很清楚:GPT-5.5 要按新模型族处理。
| 事项 | OpenAI 给出的信息 | 对开发者的影响 |
|---|---|---|
| GPT-5.5 API | 已开放 API | 可以接入,但不适合无脑替换旧模型名 |
| 提示词迁移 | 从最小 prompt baseline 开始 | 旧提示词栈需要重新验证和删减 |
| Codex 辅助迁移 | 可运行 $openai-docs migrate this project to gpt-5.5 | 借助 openai-docs skill 改造项目提示词和调用方式 |
| 多步骤任务交互 | 工具调用前先给用户 1-2 句可见进度说明 | 减少用户以为模型卡死的感知 |
OpenAI 的核心建议是:迁移时先保留产品契约,再调推理强度、输出详略、工具描述和输出格式。
这句话很工程化。它没有说旧应用会失效,也没有说 GPT-5.5 退步。它说的是:旧模型上调出来的行为,不该被默认继承。
受影响最大的是两类人。
一类是 AI 应用开发者。尤其是把长 prompt 当配置资产、靠大量规则压住输出的人。他们现在更适合先做小流量验证,而不是全量切换。
另一类是 Agent 和 Codex 用户。凡是有工具调用、多步骤任务、代码修改链路的地方,都要重新看工具描述、调用顺序和用户可见反馈。沉默太久,用户会以为系统挂了。OpenAI 建议先给一句进度说明,本质是在补产品体验,不是在炫模型能力。
真正要迁移的不是提示词,是工程基线
我更在意 OpenAI 这次说的“最小 prompt baseline”。这不是写作技巧,是工程纪律。
很多团队的提示词已经变成祖传配置:
- 不要输出某类内容;
- 必须遵循某种格式;
- 遇到异常请执行一串规则;
- 工具调用前后再补几条限制。
这些东西短期有用。长期会发胀。模型一换,旧规则可能继续有效,也可能变成噪音。
所以迁移 GPT-5.5 时,比较稳的动作不是把旧 prompt 整包搬过去,而是拆成几层看:
| 要检查的层 | 该问的问题 | 不该做的事 |
|---|---|---|
| 产品契约 | 输入是什么,输出必须满足什么 | 把风格偏好当硬约束 |
| 输出格式 | JSON、表格、字段是否稳定 | 只凭肉眼看几次回答 |
| 工具描述 | 何时调用、参数怎么填、失败怎么处理 | 沿用旧模型的工具触发话术 |
| 推理预算 | 任务是否需要更高 reasoning effort | 所有任务一刀切加大成本 |
| 用户反馈 | 长任务是否给可见进度 | 让用户盯着空白界面等待 |
这里有一个现实约束:原始材料没有给 GPT-5.5 的价格、性能分数、上下文长度或 benchmark。现在不能下结论说它一定更便宜、更强,或者一定适合所有场景。
能确定的是,OpenAI 要求开发者重新调优和验证。这个信号已经够重。
如果你在维护生产环境,动作应该更保守:先建代表性样例,跑回归评估,再挑低风险链路灰度。尤其是那些依赖固定格式、工具调用和自动执行的功能,不该只靠“看起来回答不错”就上线。
采购或平台团队也会受影响。原来评估模型,可能看一次 demo、跑几条任务就够了。现在要多问一句:迁移成本谁承担?旧提示词栈要不要重写?工具链日志和失败样例有没有留?
没有这些东西,模型升级就是开盲盒。
提示词不是护城河,可迁移性才是
过去两年,很多 AI 应用把 prompt 当护城河。话术越长,规则越多,好像壁垒越高。
我不太买账。
真正的护城河不是一大坨提示词,而是可测试、可迁移、可重构的产品契约。模型厂商会继续换模型族,开发者也会继续追新能力。夹在中间的应用团队,迟早要为自己的工程债付账。
“天下熙熙,皆为利来。”这句话放在这里并不玄。团队追 GPT-5.5,是因为新模型可能带来更好的能力和卖点;但模型厂商不会替你保证旧 prompt 永远有效。它最多给你迁移指南。
这就是利益结构。
对 AI 应用团队来说,接下来最该观察的不是宣传页上的形容词,而是三件小事:
- 旧任务在 GPT-5.5 上的失败类型有没有变化;
- 工具调用是否更稳定,还是需要改描述和流程;
- 从最小 baseline 重建后,成本、延迟、输出质量能不能同时接受。
如果这三件事跑通,迁移才有意义。跑不通,就先观望。换模型不丢人,盲切才危险。
GPT-5.5 这次真正提醒开发者的是:LLM 应用不能把模型行为当固定地基。模型会动,地基就得建在测试、契约和流程上。
车头可以换。轨道要自己养。
