Claude Fable 5：单提示原型开始像交付了

核心摘要 Summary

一次提示，在 Claude Code 里拉出 Snake、地下隧道点灯游戏 Strata、基于《杜伊诺哀歌》的 Duino，还能做等时地图可视化。

这听起来像又一条 AI 炫技新闻。但这次值得多看一眼：Claude Fable 5 是 Anthropic Mythos 模型首个公众可用版本。宾夕法尼亚大学学者 Ethan Mollick 试用后说，它明显强于自己用过的其他公开模型，还能按多页规格连续执行，最长到十几个小时。

边界也要放在前面：这不是官方基准，不是行业评测，也不能推出“游戏团队要被替代”。它更像一个重度用户的早期压力测试。但压力测试最有价值的地方，恰好在这里：单提示正在从聊天，变成任务委托。

Fable 5 做到了什么

维度	已知信息	该怎么理解
模型位置	Anthropic Mythos 模型首个公众可用版本	不是内部演示，普通用户开始能碰到这条能力线
生成案例	Snake、Strata、Duino	小游戏不是重点，可运行原型才是重点
工具案例	等时地图可视化	能处理一定复杂度的交互和数据展示
执行方式	一次提示，在 Claude Code 中推进	提示词开始承担产品规格的部分功能
执行长度	Mollick 称可按多页规格运行最长十几个小时	仍是个人测试，不能当稳定承诺
受影响对象	vibe coders、创业者、产品原型团队、小型软件团队	早期试错成本继续下降

最容易被短视频截走的，是“AI 做了个游戏”。

但最该被行业记住的，是另一件事：一个人用自然语言，能把想法推进到可运行状态。它未必漂亮，未必稳定，也未必能上线。可它已经足够改变早期决策。

过去很多项目死在第一步：没人手、没前端、没时间搭架子。现在第一步变便宜了。问题会从“能不能做出来”，转向“这个东西值不值得继续做”。

这对 vibe coders 很直接：少晒提示词，多晒验收标准。一个能跑的 demo 不稀奇，能说明用户需求、交互逻辑和失败边界，才有价值。

早期 PC 和网页工具也做过类似的事。它们没有让每个人都变成软件公司，却让更多人能先把想法做出来。门槛下降后，稀缺资源会换位置。

这一次，换得更快。

创业者和产品负责人最该调整的，不是立刻裁掉开发预算，而是把验证顺序前移。

以前可能要等一个小团队搭完 MVP，才知道方向错没错。现在可以先用 Fable 5 这类模型试三五个交互方向，再决定要不要投入设计、工程和市场资源。

小型软件团队也会改变分工。产品经理可以更早拿出可操作样机，工程师则更像验收者和改造者。粗活交给模型，硬活留给人。

这里的硬活包括：代码审查、性能、安全、数据边界、部署、监控、后续维护。说白了，模型把开局做轻了，但没有替你承担结果。

“天下熙熙，皆为利来。”技术门槛一降，最先涌进来的不只有创作者，也有包装者、投机者、赶热点的人。

Fable 5 真正利好的，是已经知道自己要验证什么的人。你有清楚问题、用户场景和判断标准，模型会放大试错速度。你只有一个模糊灵感，它也会放大模糊，产出一个能演示、但没人需要的东西。

我不太买账的，是把这类能力直接说成“替代完整软件流程”。目前证据不够。

Mollick 的测试说明它很强，尤其在长规格执行和复杂原型上有新信号。但这仍不是大规模稳定性证明。它还没有回答几个硬问题：复杂项目能否反复成功？长时间执行出错后能否自救？生成代码能否被团队长期维护？安全和性能谁负责？

接下来真正要观察的，不是又能生成多少小游戏。

要看四件事：长规格任务的成功率，失败后的可修复性，工程团队接手成本，以及这些原型能不能转化成真实用户留存。

这也是分水岭。会用模型的人会更快开局，会验收的人才更可能收尾。

创意门槛下降，不等于产品门槛下降。代码更容易出现，责任没有消失。Fable 5 把“做一个出来看看”变便宜了，也把“到底值不值得继续做”推到了更前面。

模型越强，产品判断越贵。