Anthropic 没发科学大模型，它在抢实验室工作流

核心摘要 Summary

Anthropic 发布 Claude Science，但它不是新模型，也不是更强的生物专用模型，而是把现有 Claude 包进科研计算工作台。
真正的变量是工作流入口：数据库、工具链、多智能体协作、可复现输出，谁能嵌进实验室日常，谁就更靠近科研 AI 的预算和权限。

Anthropic 这次先把误会堵死了：Claude Science 不是新模型，也不是更强的生物模型。

它跑的还是现有 Claude，包括 Claude Opus 4.8。变化不在模型大脑，而在科研桌面。Anthropic 想把数据库、代码管线、分析工具、图表、引用和协作塞进一个工作台里。

这比发布一个“科学大模型”低调。但商业味更重。

Claude Science 到底是什么

Claude Science 的定位是面向计算科研的 AI workbench。

它要解决的不是“模型会不会聊天”，而是科学家每天在不同系统之间来回切的问题。数据库查一遍，工具跑一遍，代码改一遍，图表导一遍，引用再核一遍。真正耗时间的，经常就在这些缝里。

能力	Claude Science 做什么	对科研团队的意义
数据入口	连接 60 多个科学数据库	少做重复检索和手工切换
工具链	支持基因组学、蛋白结构、化学等工具包	把模型接到科研软件和计算流程上
多智能体	主助手可生成子助手，也能调用用户自建专家助手	把复杂任务拆给不同助手处理
可复现	图表附带生成代码、环境、说明和完整消息历史	方便追溯结果从哪里来
核查	独立事实核查助手检查引用和计算	多一道检查，但不是最终裁判

最容易被夸大的就是核查。

这个事实核查助手不是外部真相源。它仍然基于同一底层模型体系。它能帮你发现一部分伪引用、错算和不一致，但不能替代实验验证、同行评议和审稿。

Anthropic 披露了几个早期案例。Gladstone Institutes 的 Sean Whalen 用它在几天内搭了一个基因组浏览器。Allen Institute 的 Jérôme Lecoq 用它构建多智能体计算综述流程，据称节省了大量人工时间。

这些案例有参考价值，也要当营销样本看。漂亮样板不是生产率革命。科研现场最难的，往往不是第一次跑通，而是第十次、第一百次还能不能复跑。

商业上，Claude Science beta 面向 Pro、Max、Team、Enterprise 用户开放。Anthropic 还提供最多 50 个科研项目支持，每个最高 3 万美元 credits，申请到 2026 年 7 月中旬结束。

这说明它想让研究团队先把流程跑起来。不是先卖神话，先占习惯。

三家公司押的不是同一条路线

把 Anthropic、OpenAI、DeepMind 放在一起看，差异很清楚。

公司	押注点	现实含义
Anthropic	工作流和操作层	不发新科学模型，先抢实验室入口
OpenAI	生物专用模型	GPT-Rosalind 是受限研究预览，面向合格美国企业客户
Google DeepMind	基础科学模型和数据库资产	AlphaFold、AlphaGenome 等资产更偏上游

OpenAI 的 GPT-Rosalind 走的是专用生物模型路线，访问更谨慎，面向通过资格和安全要求的美国企业客户。DeepMind 更像站在上游，手里有 AlphaFold、AlphaGenome 这类基础科学资产。

Anthropic 走了另一条路：不争“我有最强科学大脑”，而是争“你每天在哪个界面里工作”。

这很产品经理，也很现实。

早期办公软件、数据库、企业协作工具的战争里，很多赢家不是单点技术最漂亮的一方，而是变成了组织每天打开的入口。天下熙熙，皆为利来。放到科研 AI 里，这个“利”不只是模型能力，也是预算、权限、数据流、审计记录和团队习惯。

对药企和科研机构来说，采购判断会更麻烦。

如果只是买一个会回答问题的模型，评测相对简单。看准确率，看幻觉，看成本。但如果买的是工作台，就要看更多东西：数据能不能留在自己的基础设施里，权限怎么管，计算环境怎么复现，日志怎么审计，合规部门能不能签字。

目前公开信息还不足以回答所有部署和数据安全细节。技术团队最好别急着把核心研究流程迁进去。更合适的动作，是拿非关键项目试点：文献整理、公开数据库检索、代码草稿、图表复现、内部方法综述。

药企采购也不该只问“比 Claude 普通版强多少”。更该问：它接入现有 LIMS、ELN、数据湖和审计系统的成本有多高？迁移出去难不难？核查机制有没有外部证据链？

这才是钱会卡住的地方。

真门槛不是演示效果，是实验室日常

我更在意的是，Claude Science 把科学 AI 的竞争往下压了一层。

过去大家盯模型：谁更懂蛋白，谁更会推理，谁能写出更像论文的答案。现在问题变成：谁能接住数据、工具、代码、图表、引用、权限、审计和协作。

科研不是一段漂亮回答。科研是一条可复现的链。

Claude Science 做对的一点，是没有硬把自己包装成新科学大脑。它补的是工作流。这个方向不性感，但离真实使用更近。

风险也在这里。

今天它替实验室省掉切换成本。明天它可能增加迁移成本。工作流一旦被平台吃进去，团队习惯、数据接口、项目历史和审计记录都会沉进去。工具越顺手，换掉越痛。

最该观察的不是下一次模型分数涨多少，而是三件事：

科研团队会不会把它从辅助任务推进到核心计算流程；
机构合规和安全团队能不能接受它的权限、日志和数据边界；
事实核查能不能接入更可靠的外部证据，而不是只靠同一模型体系互相检查。

如果这三件事过不了，Claude Science 就是一个好用的科研助手集合。能省时间，但不会改写组织流程。

如果过了，它就不只是工具。它会变成科研 AI 的操作台。

模型看着更强，产品反而可能更虚。工作流看着朴素，却最容易变成入口。Anthropic 这次讲的是一个小故事：把 AI 放到科学家每天真正干活的地方。

小故事，才难缠。

Anthropic 没发科学大模型，它在抢实验室工作流

Claude Science

定位变化

工作台化

商业优先

核心能力

多工具接入

可复现输出

路线差异

OpenAI

DeepMind

采购门槛

系统接入

权限审计

后续变量

平台锁定

核查短板

Claude Science 到底是什么

三家公司押的不是同一条路线

真门槛不是演示效果，是实验室日常