Claude Fable 5 拒答基础生物学：AI 安全护栏开始误伤正常知识使用

核心摘要 Summary

Anthropic 新发布的 Claude Fable 5 被称为其广泛开放的最强模型，却会拒答细胞膜、线粒体、mRNA 疫苗等基础生物和医学问题。
关键不在于模型不会，而在于 Anthropic 为防生物武器风险主动加严护栏；这暴露出前沿模型发布时，安全控制与可用性之间的矛盾正在变得更尖锐。

内容导图 Mind Map

护栏误伤

强模型拒答基础生物

异常拒答

生物医学被宽泛拦截

基础问题

线粒体疫苗也碰壁

安全取向

防生物风险优先

主动加严

护栏被设为保守

受影响者

生命科学用户受阻

工作流中断

科研与科普场景受限

后续变量

分类精度决定边界

准入门槛

无护栏版本或分层开放

Anthropic 刚发布 Claude Fable 5，称它是公司迄今广泛开放的最强模型，也是首个面向公众的 Mythos-class 模型。但 The Verge 测试发现，这款模型会拒绝回答一批基础生物学和医学问题，包括“什么是线粒体”“细胞膜是什么”“mRNA 疫苗如何工作”等，有时会把请求转给上一代旗舰 Claude Opus 4.8。

这件事的重点不是 Fable 5 缺乏基础生物学能力，而是 Anthropic 不允许它答。公司承认，拦截是有意为之，原因是担心更强模型被用于高风险生物研究或生物武器相关请求。问题也由此变得具体：当前沿模型能力越过某条安全线，护栏究竟是在阻止危险，还是已经挡住了正常知识使用？

Fable 5 的异常拒答集中在生物和医学问题

The Verge 的测试显示，Fable 5 对不少高中或大学入门级问题直接拒答。被拦的问题覆盖细胞膜、线粒体、朊病毒、mRNA 疫苗、花粉症、哮喘药、抗生素耐药，以及埃博拉是什么、如何传播等。

这些问题本身并不等于危险操作。它们更像课堂、科普、医学基础咨询或科研入门中的常见提问。Fable 5 偶尔也会回答“什么是癌症”“什么是 DNA”这类问题，但整体上，生物相关查询被拦得很宽。

查询类型	Fable 5 表现	判断
细胞膜、线粒体、朊病毒	多数拒答	明显误伤基础教育和科普场景
mRNA 疫苗、花粉症、哮喘药	多数拒答	医学常识查询被纳入高风险过滤
TNT、氯气、密码威胁	相对更愿回答基础说明	化学和网络安全护栏没有同样“一刀切”
sarin、anthrax	拒答或转交，部分会暂停对话	对明确危险请求的限制合理

这个对照很说明问题。Anthropic 过去在 Mythos-class 发布过程中更多强调网络安全风险，称这类模型在网络任务上能力很强，公开释放需要谨慎。但真正让普通用户立刻感到受限的，反而是生物领域。

Anthropic 选择先放出能力，再用保守护栏兜底

Anthropic 发言人 Paruul Maheshwary 对 The Verge 表示，随着 Claude Fable 5 发布，公司认为模型已经具备更强的真实世界科学任务能力，也可能被恶意行为者用于高风险生物研究。为安全部署 Fable 5，Anthropic 认为必须让护栏“过度保守”，以拦截大多数与生物工作相关的查询。

这是一个典型的高能力模型发布策略：先开放一部分能力，再用分类器和拒答机制压住最危险的方向。OpenAI、Google DeepMind 等公司在模型系统卡、红队测试和危险能力评估中，也会把生物、化学、网络和自主代理能力列为重点风险区。差别在于，Fable 5 把这种风险控制直接推到了日常问答层面，用户不需要做复杂实验设计，只问线粒体也可能碰壁。

原文没有证明 Fable 5 整体不可用。限制主要集中在生物相关请求。它对化学和网络安全问题相对更愿回答，例如可解释 TNT 的基础信息但不提供合成步骤，也能说明常见密码威胁和如何保护 iPhone。对沙林毒气、炭疽制造这类明确危险请求拒答，是正常护栏；把细胞膜也拦下，才是争议所在。

受影响最大的不是闲聊用户，而是生命科学使用者

对普通用户来说，这可能只是一次奇怪的拒答；对生命科学和医学研究群体，它会直接影响工具选择。一个研究助理如果只是想整理文献背景、解释疫苗机制、准备实验伦理材料，Fable 5 的拒答会让工作流中断。团队采购 AI 工具时，也会更倾向于测试“能否稳定回答本领域基础问题”，而不只看模型榜单或厂商宣传。

Anthropic 承认存在 false positives，并称正在改进检测、减少误拦。公司还表示，未来希望向更广泛的生物和生命科学群体开放不带这些护栏的 Mythos-class 能力，用于加速生物医学研究和药物发现。但这里仍有一个没回答的现实问题：谁能获得“无护栏”版本，依据是什么，审查成本由谁承担？

这也是读者单看发布新闻容易忽略的限制。安全发布不是只有“开”与“关”两个按钮，它会变成身份认证、机构准入、日志审计、合规责任和客户分层。对高校、小型生物科技公司、独立研究者来说，最强模型如果只能在严格渠道里使用，成本和门槛会明显上升。

接下来最该观察的不是 Fable 5 会不会回答“线粒体”，而是 Anthropic 是否能把生物安全分类做细：区分基础知识、医学科普、合法科研设计和危险操作请求。如果做不到，前沿模型会形成一种新常态——能力越来越强，可真正能用的区域却被切得越来越窄。

锐评 Commentary

防险有功，误伤有价。护栏若不辨良莠，强模型也会自缚手脚。

Claude Fable 5AnthropicAI安全护栏拒答生物安全大语言模型模型可用性基础生物学mRNA疫苗The Verge