Google AI Overviews 把“ignore”当指令：不是搜索坏了，是边界串线了

核心摘要 Summary

Google 搜索里的 AI Overviews 在部分查询中出现异常：搜索“disregard”“ignore”“skip”等词时，它没有生成搜索摘要，而是回了“Got it”“No problem”“Message received”这类聊天式确认。
The Verge 多名同事复现过，但结果会变化，不能扩大成所有用户、所有地区都受影响。
我的判断是，这更像短期 bug，不是 Google 搜索整体失灵；但它暴露了 AI 搜索最关键的一道边界：用户是在查词，还是在下指令。

用户在 Google 搜索框里输入“ignore”，正常预期是查这个词的含义、用法，或者看到相关网页。

但 AI Overviews 在部分情况下没有做摘要，而是像聊天机器人一样回了一句：收到、没问题、我准备好了。

这件事有意思的地方不在于它好笑，而在于它很反常。搜索框本来是检索入口，AI Overviews 却短暂表现得像一个聊天窗口。用户明明在查一个词，系统却像在执行一条指令。

这不是“Google 搜索不可用”。目前能确定的范围更窄：异常出现在 AI Overviews 这个生成式摘要区域，而且触发词集中在“disregard”“ignore”“skip”等更像命令的词上。

发生了什么：AI 摘要区回了聊天确认

The Verge 提到，多名同事搜索相关词时复现了这个现象。结果并不完全一样，不同人、不同时间看到的回复会变化。

几个典型返回都不是搜索摘要，而是聊天机器人常见的确认句。

搜索词	AI Overviews 返回示例	问题在哪里
disregard	“Got it!” / “No problem at all!”	像是在确认已按要求忽略某事
ignore	“Message received!”	像是在回应一条聊天指令
skip	“It looks like your message was just a test or a typo!”	像是在判断用户输入是否有效

AI Overviews 原本应该做的是：根据搜索结果，给出一段网页内容摘要。它不是独立聊天窗口。

所以这次异常的关键不是“答得准不准”，而是“有没有进入正确任务”。

目前也要把边界说清。没有证据表明这是提示注入、模型越狱或系统提示泄露。Google 截至原文发布时也没有回应 The Verge 的置评请求。

更稳的说法是：AI Overviews 在少数触发词上，把搜索查询和聊天指令混在了一起。

传统搜索也会出错。比如拼写纠错错了，排序不理想，知识卡片给了不完整信息。

但传统搜索的底层动作仍然很清楚：用户输入查询，系统返回结果。即便第一条不好，下面还有网页列表可以看。

AI Overviews 的位置更靠前，也更像一个“答案”。一旦它错位，用户第一眼看到的就不是资料线索，而是一句客气但无用的回复。

这对普通用户的成本不算高。大不了跳过 AI 摘要，往下看网页结果，或者换个关键词。

但对关注 AI 搜索产品的人，这个 bug 提醒了一件事：AI 搜索不是把大模型接到搜索结果页就完事。它至少要稳定处理三件事：

对搜索和内容分发从业者，影响更实际。

如果团队正在评估 AI Overviews 对流量入口的影响，这类异常不该被当成“Google 全面失控”的证据，但可以被纳入监测项。更合理的动作是：把重点关键词、品牌词、短查询词单独抽样，记录 AI 摘要是否出现、是否引用来源、是否偏离查询意图。

SEO 团队也不必因为一个 bug 立刻改策略。更现实的做法是延后对单次异常的判断，把观察周期拉长。一次“Got it”说明不了流量规则变了，但连续错位就会影响首屏信任。

这次问题更像短期 bug。原因很简单：触发词少，表现集中，返回内容还会变化。

The Verge 的复现也说明，现象不是每次都稳定出现。外部看不到 Google 内部的模型版本、灰度实验、地区配置或会话状态，所以不能把技术原因说死。

真正该看的不是 Google 会不会把“ignore”“skip”这几个词修掉。这个大概率不难。

更该看的，是修完以后 AI Overviews 在更多边缘查询里是否还能守住搜索属性。比如很短的词、像命令的词、容易被当成提示的词、没有明确上下文的词。

Google 此前大规模推出 AI Overviews 后，已经因为生成离谱建议调整过展示和回答机制。那类争议主要是“答案质量”问题：它有没有说对。

这一次更靠近“任务边界”问题：它有没有做对事。

差别很大。

答案质量差，用户还可以追问、核对来源、换关键词。任务边界错了，系统一开始就站错了位置。用户要的是搜索摘要，它给的是聊天确认。

这也是 AI 搜索和传统搜索的核心差异。传统搜索的错误多半发生在排序和匹配上；AI 搜索的错误还可能发生在角色上。

一个搜索产品可以变得更会解释，但不能忘了自己是搜索。名实相副，才有信任可谈。