AWS 改造 OpenSearch：互联网的默认用户，正在从人变成机器

核心摘要 Summary

AWS 新一代 OpenSearch Serverless 把搜索与向量检索底层改成更适合 AI agent 的形态：计算存储解耦、秒级扩容、空闲 compute 可缩到零。
Cloudflare 的数据也在指向同一件事：非人类流量还没统治互联网，但已经开始改变云、数据库、API 的成本模型。
对开发者和企业技术负责人来说，接下来要盯的不是模型演示，而是 agent 每次任务背后的检索、调用、权限和账单。

Cloudflare 给了一个很硬的数字：过去六个月，bot 已经占 HTTP 流量的 31%。其中，AI 爬虫、搜索引擎和助手大约占 bot 请求的四分之一。

这不等于 AI agent 已经接管互联网。还早。但基础设施公司已经在按机器流量改路。Cloudflare 预计，非人类流量会在 2027 年上半年超过人类流量。

AWS 这次发布的新一代 OpenSearch Serverless，表面是云产品更新。真正值得看的是它承认了一种新负载：不是人慢慢点网页，而是 agent 瞬间拉起一串查询、检索和 API 调用，然后消失。

AWS 发了什么：搜索和向量检索开始为 agent 改底座

OpenSearch Serverless 的关键变化，是计算与存储解耦。

这意味着计算资源可以在任务爆发时秒级扩上去，空闲时缩到零。这里的“零”只指空闲 compute 不再付费，不是存储、请求、数据传输等成本全部归零。

这点很重要。AI agent 的负载不像传统网站。

对比项	人类互联网	agent 互联网
行为节奏	搜索、点击、停留	并发查询、连续调用
负载形态	相对稳定，有峰谷	突然爆发，迅速归零
成本压力	页面、带宽、缓存	搜索、向量检索、API、数据库
工程难点	扛高峰	别为闲置 compute 白付钱

一个 agent 接到任务后，可能马上启动多个子 agent：查数据库、搜文档、读企业知识库、调用 API、写入向量库。几秒钟内打出一串请求，任务结束后又没有持续流量。

传统容量规划最怕峰值。agent 时代还多了一个问题：峰值来得更碎、更频、更难预测。你不能只为最猛的几秒长期养一批空闲计算资源。

所以 AWS 这个更新不是“省点钱”的小功能。它是在把搜索和向量检索做成更贴近 agent 调度方式的基础设施。

限制也要说清。OpenSearch Serverless 不是所有 agent 场景的万能解。高频、长期稳定、强定制的负载，未必一定适合完全 serverless。企业还要看延迟、吞吐、权限、数据驻留和账单可预测性。

但方向已经够明确：搜索系统正在从“给人找网页”，变成“给机器找上下文”。

为什么重要：机器不会停下来犹豫，只会继续调用

人类互联网有一个隐含前提：用户会累。

人会停下来读，会犹豫，会关闭页面。哪怕是大促、热点新闻、直播，流量也大体围绕人的节奏展开。

机器不是这样。机器只看任务链路和调用成本。只要权限允许、预算没爆，它可以连续搜索、连续检索、连续请求 API。

这会把很多产品团队的旧账本打穿。

过去，API、数据库、搜索服务的计费模型默认“人类使用频率”在背后兜底。现在如果接入 agent，同一个用户动作背后可能变成几十次检索、几十次 API 调用、多个数据库查询。

模型看着更强，产品反而可能更虚。因为真正的瓶颈会从“回答聪不聪明”，转到四个更硬的问题：调用贵不贵、延迟稳不稳、权限控不控得住、账单能不能解释。

这也是为什么不止 AWS 在动。

公司	调整方向	指向的问题
AWS	OpenSearch Serverless 适配突发检索负载	agent 检索与向量搜索成本
Cloudflare	为机器流量、持久环境和瞬时扩展做基础设施	非人类请求增长后的边缘与执行环境
Databricks / Snowflake	把企业数据平台包装成 AI 记忆与检索层	企业数据如何被 agent 安全调用
Microsoft	在 Azure 侧处理 agent 爆发负载和共享记忆	企业 agent 的运行与协作成本
Google	推消费者把购物研究、旅行预订等任务委托给 AI	人的任务入口被 agent 接管

这不是某一家云厂商在包装新品，而是一批基础设施公司在抢同一个位置：agent 的记忆层、检索层和执行层。

“天下熙熙，皆为利来。”这句话放在这里很合适。谁能让 agent 更便宜、更快、更稳，谁就更靠近下一代应用入口。

浏览器时代，入口是搜索框和网址。移动时代，入口是 App 和应用商店。agent 时代，入口可能更底层：向量数据库、搜索后端、API 网关、权限系统、持久运行环境。

不完全一样，但历史味道很熟。铁路先改了货物流动，电网先改了工厂布局，云计算先改了软件交付。基础设施一旦变便宜，应用形态就会跟着变。

今天的 agent 还没到那个阶段。但云厂商已经开始修路。修路的人，通常不是为了风景。

谁最受影响：开发者要算账，技术负责人要控闸门

这件事最该看的，不是普通用户。普通用户短期只会感到 AI 功能变多。

真正要动手的是两类人：做 agent 落地的开发者，以及负责企业技术采购和架构的技术负责人。

对开发者来说，下一步不是急着把 agent 接满所有系统，而是先把每次任务拆成账本：一次回答查几次向量库、调几次 API、读多少文档、写多少缓存、失败重试几轮。

能缓存的缓存。能合并的调用合并。能限制并发的限制并发。不要等月底云账单来教育团队。

对企业技术负责人来说，更现实的动作是延后“一步到位”的大迁移，先做小范围压测和权限边界设计。尤其要看三件事：峰值成本、延迟稳定性、数据访问权限。

角色	现在该做什么	最该避开的坑
agent 开发者	给每个任务链路算检索、API、数据库调用次数	只看模型价格，不看工具调用总成本
企业技术负责人	先压测，再采购；先设权限，再放开 agent	把 agent 当聊天机器人，而不是自动化调用系统
API / 搜索 / 数据库产品团队	重审限流、计费、缓存和机器访问策略	继续按人类点击频率设计价格和风控

API 产品团队也要醒得更早一点。过去，一个真实用户一天调几次接口。现在，一个 agent 可能替同一个用户在一分钟内调几十次。

这不是流量变多这么简单。它会逼产品重新设计限流、套餐、反滥用规则和机器访问价格。Cloudflare 的 bot 数据不能直接等同于 agent 流量，但它已经提醒了一个方向：非人类访问会越来越像基础流量，而不是边缘异常。

接下来最该观察两个变量。

第一个，是 agent 任务的单位经济账。一次任务到底要消耗多少检索、推理、API 和存储。只要这个账算不平，agent 就只能留在演示和少数高价值场景里。

第二个，是云和数据平台会不会把“记忆、检索、持久环境、权限”打包成新的默认入口。谁把这套东西做得足够顺，谁就可能变成 agent 部署的收费站。

我不太买账那些把 agent 说成已经统治互联网的叙事。现在还没有。Cloudflare 数据里的 AI 爬虫、搜索和助手，只是 bot 请求的一部分，生产级 agent 流量也还在早期。

但我也不建议低估这次变化。基础设施公司不会为了几张演示幻灯片去改底层计费和扩缩容模型。它们闻到的是下一轮账单。

AWS 这次 OpenSearch Serverless 的意义就在这里：不是宣布机器已经赢了，而是提前把收费口、检索层和弹性计算摆到路边。

人还在点网页。机器已经开始改写网页背后的成本结构。

AWS 改造 OpenSearch：互联网的默认用户，正在从人变成机器

机器流量

底座改造

弹性计算

流量变形

bot 占比

成本重算

调用放大

产业抢位

三层入口

AWS 发了什么：搜索和向量检索开始为 agent 改底座

为什么重要：机器不会停下来犹豫，只会继续调用

谁最受影响：开发者要算账，技术负责人要控闸门