一台放在厨房台面的 Google Home,被主人拔掉了插头。

导火索很小:她问演员 Geena Davis 多少岁,设备却回答“不提供这类事实”。

据 The Art of Doing Stuff 作者 Karen 6 月 12 日发布的文章,她过去用 Google Home 做的事很简单:做饭时问单位换算,听歌时识曲,看棒球比分,查演员年龄。现在,接入 Gemini 后,这些短问题变得啰嗦、回避,甚至不稳定。

这只是一个用户的体验,不能直接说成 Google Home 或 Gemini 的普遍故障。原文也没有给出具体设备型号、版本信息,或 Google 官方回应。

但这个例子很有代表性。它指向一个更大的产品问题:语音助手被 AI 化之后,是不是牺牲了原本最值钱的能力——快速给出简单答案。

简单问题,不该变成一段解释

Karen 对 Google Home 的不满,集中在几个生活场景里。

这些问题都不复杂。它们也不是“智能体任务”。用户不需要模型展开推理,不需要讲背景,更不需要把一次厨房查询变成一次对话。

使用场景过去的期待Gemini 后的吐槽直接影响
烹饪换算半杯等于几汤匙,直接给数字回答变长,不能只给“8”做饭时被打断
识别歌曲听到歌,快速识曲作者称功能消失家庭高频小工具失效
体育比分给当前比分曾给出数局前比分即时信息可信度下降
医疗相关问题简短回答常识问题先给免责声明用户要多听一段话
人物年龄直接回答事实Geena Davis 年龄未答简单事实也有摩擦

这里最刺人的,不是 Gemini 不会聊天。恰恰相反,它更像是“太会说”。

问脱水是否会导致头痛,它先声明自己不是医疗专业人士。这个处理可以理解,医疗问题确实有风险。但用户在厨房里问一个常识问题时,最想要的是边界清楚的短答,而不是一段仪式化的自我保护。

问半杯是多少汤匙,答案就是 8。多出来的解释,在网页搜索里可能还算完整,在语音场景里就是噪音。

语音助手的第一价值,是免手操作。手上有面粉、锅在火上、电视还开着,用户不想盯屏幕,也不想听长段落。

所以问题不在于 AI 有没有变强。问题在于,它有没有把“短、准、稳”这件小事弄丢。

这不是 Alexa 赢了,而是旧工具被新能力挤掉了

Karen 后来买了 Alexa。但这不等于她认可 Amazon,也不等于 Alexa 全面胜出。

更准确地说,这是一次反弹式替代。一个原本顺手的工具失灵了,用户就换一个还能完成基础任务的设备。

这点很重要。因为如果把这件事写成“Google 输给 Amazon”,反而会看偏。

真正的对比不是 Google 和 Amazon,而是两种产品逻辑:

对比对象核心目标用户感受
有用的旧语音助手听懂短命令,给短答案像开关,省事
更 AI 化的新助手更会解释,更会规避,更会对话像客服,打断流程

Google 在 2024 年将 Bard 更名为 Gemini,并持续把生成式 AI 能力放进搜索、Android 和助手类产品。这条路线不奇怪。科技公司需要证明助手不只是报天气、设闹钟、查单位。

可家用智能音箱不是演示台。

它被放在厨房、客厅、卧室。它被使用的时间,往往是用户没空操作手机的时候。这个场景天然反对长回答。

很多 AI 产品升级,都容易掉进“过度改进”的坑。原来用户买它,是因为它像工具。升级之后,它变得像一个随时准备展开讨论的人。

工具一旦开始打扰人,就很难再被信任。

这里也有现实约束。生成式 AI 要处理风险问题,要避免给出不可靠答案,也要适配更多复杂请求。厂商不可能把所有回答都压成一个词。

但语音助手至少应该区分场景。查人物年龄、单位换算、当前比分,这类事实型短任务,本来就应该优先短答。需要补充时,再让用户追问。

少说,不是能力弱。很多时候是产品判断更强。

受影响的人,该先看自己的高频问题

这件事对智能音箱用户的提醒很直接:不要只看宣传里的“更智能”。要看它还能不能稳定回答你每天最常问的十个问题。

如果你主要用音箱做饭、开灯、设定时器、查天气、听歌识曲,那就先观望。换设备前,最好测试几个高频问题:单位换算是否直答,比分是否及时,识曲是否还在,人物年龄这类普通事实是否会回避。

如果你正在给家里老人、孩子或厨房场景采购智能音箱,动作可以更保守一点。先别急着因为 AI 升级就换新。短任务稳定性,比“能不能聊天”更重要。

对关注 AI 产品体验的人,这个案例也值得记下来。它说明模型能力提升和产品可用性提升,不是同一件事。

目前还看不清的,是 Google 会不会在家庭设备上提供更明确的选择。比如“简短回答”“直接事实”“少解释模式”。原文没有提供相关设置验证,也没有 Google 回应,所以不能下定论。

但观察点很清楚:

  • 简单事实是否能直答;
  • 语音回答是否明显变长;
  • 旧功能是否被保留,比如识曲;
  • 用户能否切换回答风格,而不是被迫接受同一种 AI 人格。

这才是 AI 助手进入家庭后的硬指标。

厨房里的问题本来很朴素:半杯是多少汤匙,比分现在多少,Geena Davis 多少岁。用户问这些,不是想测试大模型边界,而是想把手头的事做完。

如果一次升级让设备更能说,却更难用,那它就不是进步,只是把炫技摆在了用处前面。

器以致用。音箱放在厨房里,先得像个好工具,再谈像不像聪明人。