Anthropic 刚发布 Claude Fable 5,称它是公司迄今广泛开放的最强模型,也是首个面向公众的 Mythos-class 模型。但 The Verge 测试发现,这款模型会拒绝回答一批基础生物学和医学问题,包括“什么是线粒体”“细胞膜是什么”“mRNA 疫苗如何工作”等,有时会把请求转给上一代旗舰 Claude Opus 4.8。
这件事的重点不是 Fable 5 缺乏基础生物学能力,而是 Anthropic 不允许它答。公司承认,拦截是有意为之,原因是担心更强模型被用于高风险生物研究或生物武器相关请求。问题也由此变得具体:当前沿模型能力越过某条安全线,护栏究竟是在阻止危险,还是已经挡住了正常知识使用?
Fable 5 的异常拒答集中在生物和医学问题
The Verge 的测试显示,Fable 5 对不少高中或大学入门级问题直接拒答。被拦的问题覆盖细胞膜、线粒体、朊病毒、mRNA 疫苗、花粉症、哮喘药、抗生素耐药,以及埃博拉是什么、如何传播等。
这些问题本身并不等于危险操作。它们更像课堂、科普、医学基础咨询或科研入门中的常见提问。Fable 5 偶尔也会回答“什么是癌症”“什么是 DNA”这类问题,但整体上,生物相关查询被拦得很宽。
| 查询类型 | Fable 5 表现 | 判断 |
|---|---|---|
| 细胞膜、线粒体、朊病毒 | 多数拒答 | 明显误伤基础教育和科普场景 |
| mRNA 疫苗、花粉症、哮喘药 | 多数拒答 | 医学常识查询被纳入高风险过滤 |
| TNT、氯气、密码威胁 | 相对更愿回答基础说明 | 化学和网络安全护栏没有同样“一刀切” |
| sarin、anthrax | 拒答或转交,部分会暂停对话 | 对明确危险请求的限制合理 |
这个对照很说明问题。Anthropic 过去在 Mythos-class 发布过程中更多强调网络安全风险,称这类模型在网络任务上能力很强,公开释放需要谨慎。但真正让普通用户立刻感到受限的,反而是生物领域。
Anthropic 选择先放出能力,再用保守护栏兜底
Anthropic 发言人 Paruul Maheshwary 对 The Verge 表示,随着 Claude Fable 5 发布,公司认为模型已经具备更强的真实世界科学任务能力,也可能被恶意行为者用于高风险生物研究。为安全部署 Fable 5,Anthropic 认为必须让护栏“过度保守”,以拦截大多数与生物工作相关的查询。
这是一个典型的高能力模型发布策略:先开放一部分能力,再用分类器和拒答机制压住最危险的方向。OpenAI、Google DeepMind 等公司在模型系统卡、红队测试和危险能力评估中,也会把生物、化学、网络和自主代理能力列为重点风险区。差别在于,Fable 5 把这种风险控制直接推到了日常问答层面,用户不需要做复杂实验设计,只问线粒体也可能碰壁。
原文没有证明 Fable 5 整体不可用。限制主要集中在生物相关请求。它对化学和网络安全问题相对更愿回答,例如可解释 TNT 的基础信息但不提供合成步骤,也能说明常见密码威胁和如何保护 iPhone。对沙林毒气、炭疽制造这类明确危险请求拒答,是正常护栏;把细胞膜也拦下,才是争议所在。
受影响最大的不是闲聊用户,而是生命科学使用者
对普通用户来说,这可能只是一次奇怪的拒答;对生命科学和医学研究群体,它会直接影响工具选择。一个研究助理如果只是想整理文献背景、解释疫苗机制、准备实验伦理材料,Fable 5 的拒答会让工作流中断。团队采购 AI 工具时,也会更倾向于测试“能否稳定回答本领域基础问题”,而不只看模型榜单或厂商宣传。
Anthropic 承认存在 false positives,并称正在改进检测、减少误拦。公司还表示,未来希望向更广泛的生物和生命科学群体开放不带这些护栏的 Mythos-class 能力,用于加速生物医学研究和药物发现。但这里仍有一个没回答的现实问题:谁能获得“无护栏”版本,依据是什么,审查成本由谁承担?
这也是读者单看发布新闻容易忽略的限制。安全发布不是只有“开”与“关”两个按钮,它会变成身份认证、机构准入、日志审计、合规责任和客户分层。对高校、小型生物科技公司、独立研究者来说,最强模型如果只能在严格渠道里使用,成本和门槛会明显上升。
接下来最该观察的不是 Fable 5 会不会回答“线粒体”,而是 Anthropic 是否能把生物安全分类做细:区分基础知识、医学科普、合法科研设计和危险操作请求。如果做不到,前沿模型会形成一种新常态——能力越来越强,可真正能用的区域却被切得越来越窄。
