Anthropic 这次先把误会堵死了:Claude Science 不是新模型,也不是更强的生物模型。

它跑的还是现有 Claude,包括 Claude Opus 4.8。变化不在模型大脑,而在科研桌面。Anthropic 想把数据库、代码管线、分析工具、图表、引用和协作塞进一个工作台里。

这比发布一个“科学大模型”低调。但商业味更重。

Claude Science 到底是什么

Claude Science 的定位是面向计算科研的 AI workbench。

它要解决的不是“模型会不会聊天”,而是科学家每天在不同系统之间来回切的问题。数据库查一遍,工具跑一遍,代码改一遍,图表导一遍,引用再核一遍。真正耗时间的,经常就在这些缝里。

能力Claude Science 做什么对科研团队的意义
数据入口连接 60 多个科学数据库少做重复检索和手工切换
工具链支持基因组学、蛋白结构、化学等工具包把模型接到科研软件和计算流程上
多智能体主助手可生成子助手,也能调用用户自建专家助手把复杂任务拆给不同助手处理
可复现图表附带生成代码、环境、说明和完整消息历史方便追溯结果从哪里来
核查独立事实核查助手检查引用和计算多一道检查,但不是最终裁判

最容易被夸大的就是核查。

这个事实核查助手不是外部真相源。它仍然基于同一底层模型体系。它能帮你发现一部分伪引用、错算和不一致,但不能替代实验验证、同行评议和审稿。

Anthropic 披露了几个早期案例。Gladstone Institutes 的 Sean Whalen 用它在几天内搭了一个基因组浏览器。Allen Institute 的 Jérôme Lecoq 用它构建多智能体计算综述流程,据称节省了大量人工时间。

这些案例有参考价值,也要当营销样本看。漂亮样板不是生产率革命。科研现场最难的,往往不是第一次跑通,而是第十次、第一百次还能不能复跑。

商业上,Claude Science beta 面向 Pro、Max、Team、Enterprise 用户开放。Anthropic 还提供最多 50 个科研项目支持,每个最高 3 万美元 credits,申请到 2026 年 7 月中旬结束。

这说明它想让研究团队先把流程跑起来。不是先卖神话,先占习惯。

三家公司押的不是同一条路线

把 Anthropic、OpenAI、DeepMind 放在一起看,差异很清楚。

公司押注点现实含义
Anthropic工作流和操作层不发新科学模型,先抢实验室入口
OpenAI生物专用模型GPT-Rosalind 是受限研究预览,面向合格美国企业客户
Google DeepMind基础科学模型和数据库资产AlphaFold、AlphaGenome 等资产更偏上游

OpenAI 的 GPT-Rosalind 走的是专用生物模型路线,访问更谨慎,面向通过资格和安全要求的美国企业客户。DeepMind 更像站在上游,手里有 AlphaFold、AlphaGenome 这类基础科学资产。

Anthropic 走了另一条路:不争“我有最强科学大脑”,而是争“你每天在哪个界面里工作”。

这很产品经理,也很现实。

早期办公软件、数据库、企业协作工具的战争里,很多赢家不是单点技术最漂亮的一方,而是变成了组织每天打开的入口。天下熙熙,皆为利来。放到科研 AI 里,这个“利”不只是模型能力,也是预算、权限、数据流、审计记录和团队习惯。

对药企和科研机构来说,采购判断会更麻烦。

如果只是买一个会回答问题的模型,评测相对简单。看准确率,看幻觉,看成本。但如果买的是工作台,就要看更多东西:数据能不能留在自己的基础设施里,权限怎么管,计算环境怎么复现,日志怎么审计,合规部门能不能签字。

目前公开信息还不足以回答所有部署和数据安全细节。技术团队最好别急着把核心研究流程迁进去。更合适的动作,是拿非关键项目试点:文献整理、公开数据库检索、代码草稿、图表复现、内部方法综述。

药企采购也不该只问“比 Claude 普通版强多少”。更该问:它接入现有 LIMS、ELN、数据湖和审计系统的成本有多高?迁移出去难不难?核查机制有没有外部证据链?

这才是钱会卡住的地方。

真门槛不是演示效果,是实验室日常

我更在意的是,Claude Science 把科学 AI 的竞争往下压了一层。

过去大家盯模型:谁更懂蛋白,谁更会推理,谁能写出更像论文的答案。现在问题变成:谁能接住数据、工具、代码、图表、引用、权限、审计和协作。

科研不是一段漂亮回答。科研是一条可复现的链。

Claude Science 做对的一点,是没有硬把自己包装成新科学大脑。它补的是工作流。这个方向不性感,但离真实使用更近。

风险也在这里。

今天它替实验室省掉切换成本。明天它可能增加迁移成本。工作流一旦被平台吃进去,团队习惯、数据接口、项目历史和审计记录都会沉进去。工具越顺手,换掉越痛。

最该观察的不是下一次模型分数涨多少,而是三件事:

  • 科研团队会不会把它从辅助任务推进到核心计算流程;
  • 机构合规和安全团队能不能接受它的权限、日志和数据边界;
  • 事实核查能不能接入更可靠的外部证据,而不是只靠同一模型体系互相检查。

如果这三件事过不了,Claude Science 就是一个好用的科研助手集合。能省时间,但不会改写组织流程。

如果过了,它就不只是工具。它会变成科研 AI 的操作台。

模型看着更强,产品反而可能更虚。工作流看着朴素,却最容易变成入口。Anthropic 这次讲的是一个小故事:把 AI 放到科学家每天真正干活的地方。

小故事,才难缠。