用户在 Google 搜索框里输入“ignore”,正常预期是查这个词的含义、用法,或者看到相关网页。
但 AI Overviews 在部分情况下没有做摘要,而是像聊天机器人一样回了一句:收到、没问题、我准备好了。
这件事有意思的地方不在于它好笑,而在于它很反常。搜索框本来是检索入口,AI Overviews 却短暂表现得像一个聊天窗口。用户明明在查一个词,系统却像在执行一条指令。
这不是“Google 搜索不可用”。目前能确定的范围更窄:异常出现在 AI Overviews 这个生成式摘要区域,而且触发词集中在“disregard”“ignore”“skip”等更像命令的词上。
发生了什么:AI 摘要区回了聊天确认
The Verge 提到,多名同事搜索相关词时复现了这个现象。结果并不完全一样,不同人、不同时间看到的回复会变化。
几个典型返回都不是搜索摘要,而是聊天机器人常见的确认句。
| 搜索词 | AI Overviews 返回示例 | 问题在哪里 |
|---|---|---|
| disregard | “Got it!” / “No problem at all!” | 像是在确认已按要求忽略某事 |
| ignore | “Message received!” | 像是在回应一条聊天指令 |
| skip | “It looks like your message was just a test or a typo!” | 像是在判断用户输入是否有效 |
AI Overviews 原本应该做的是:根据搜索结果,给出一段网页内容摘要。它不是独立聊天窗口。
所以这次异常的关键不是“答得准不准”,而是“有没有进入正确任务”。
目前也要把边界说清。没有证据表明这是提示注入、模型越狱或系统提示泄露。Google 截至原文发布时也没有回应 The Verge 的置评请求。
更稳的说法是:AI Overviews 在少数触发词上,把搜索查询和聊天指令混在了一起。
为什么重要:搜索框和聊天框不能混成一个东西
传统搜索也会出错。比如拼写纠错错了,排序不理想,知识卡片给了不完整信息。
但传统搜索的底层动作仍然很清楚:用户输入查询,系统返回结果。即便第一条不好,下面还有网页列表可以看。
AI Overviews 的位置更靠前,也更像一个“答案”。一旦它错位,用户第一眼看到的就不是资料线索,而是一句客气但无用的回复。
这对普通用户的成本不算高。大不了跳过 AI 摘要,往下看网页结果,或者换个关键词。
但对关注 AI 搜索产品的人,这个 bug 提醒了一件事:AI 搜索不是把大模型接到搜索结果页就完事。它至少要稳定处理三件事:
- 识别用户是在查资料,还是在和系统对话;
- 判断什么时候该生成摘要,什么时候该回退到普通搜索结果;
- 遇到边缘词、短词、命令式词语时,不要让聊天模型的习惯抢走搜索任务。
对搜索和内容分发从业者,影响更实际。
如果团队正在评估 AI Overviews 对流量入口的影响,这类异常不该被当成“Google 全面失控”的证据,但可以被纳入监测项。更合理的动作是:把重点关键词、品牌词、短查询词单独抽样,记录 AI 摘要是否出现、是否引用来源、是否偏离查询意图。
SEO 团队也不必因为一个 bug 立刻改策略。更现实的做法是延后对单次异常的判断,把观察周期拉长。一次“Got it”说明不了流量规则变了,但连续错位就会影响首屏信任。
接下来该看什么:修触发词不难,难的是稳定边界
这次问题更像短期 bug。原因很简单:触发词少,表现集中,返回内容还会变化。
The Verge 的复现也说明,现象不是每次都稳定出现。外部看不到 Google 内部的模型版本、灰度实验、地区配置或会话状态,所以不能把技术原因说死。
真正该看的不是 Google 会不会把“ignore”“skip”这几个词修掉。这个大概率不难。
更该看的,是修完以后 AI Overviews 在更多边缘查询里是否还能守住搜索属性。比如很短的词、像命令的词、容易被当成提示的词、没有明确上下文的词。
Google 此前大规模推出 AI Overviews 后,已经因为生成离谱建议调整过展示和回答机制。那类争议主要是“答案质量”问题:它有没有说对。
这一次更靠近“任务边界”问题:它有没有做对事。
差别很大。
答案质量差,用户还可以追问、核对来源、换关键词。任务边界错了,系统一开始就站错了位置。用户要的是搜索摘要,它给的是聊天确认。
这也是 AI 搜索和传统搜索的核心差异。传统搜索的错误多半发生在排序和匹配上;AI 搜索的错误还可能发生在角色上。
一个搜索产品可以变得更会解释,但不能忘了自己是搜索。名实相副,才有信任可谈。
