《华尔街日报》最近写到一个很具体的变化:Wispr 等语音听写应用开始在创业公司圈层走红,原因之一是它们能连接 vibe coding 工具,把口述内容送进 AI 编程和办公流程。

这件事有意思的地方,不是“键盘要消失了”。现在还看不到这个结论。更准确地说,是一些人开始把对电脑说话,当成调用 AI 的入口。

问题也跟着来了。

如果一个办公室里,越来越多人不再安静打字,而是戴着耳机、压低声音、持续对电脑交代任务,这个空间还算安静办公室吗?

语音输入不新,新的是它接上了 AI 工作流

语音听写不是新产品。Nuance 的 Dragon NaturallySpeaking 很早就服务过专业听写场景。苹果、Google Docs、Windows 也长期提供系统级语音输入。

过去它更像键盘的补充。写邮件、做笔记、手不方便时输入一段话,都是典型场景。

这轮变化在于,语音不只是把话转成字。接入 AI 编程和办公工具后,它可以变成“下指令”的入口。

vibe coding 的逻辑本来就是用自然语言驱动代码修改、解释、测试和生成。键盘输入提示词可以,口述提示词也可以。Wispr 这类工具的吸引力,正是卡在这里。

Gusto 联合创始人 Edward Kim 说,自己现在只有必要时才打字。这个个案不能说明键盘被淘汰,但至少表明,在部分高频使用 AI 工具的人那里,语音已经进入原本高度依赖键盘的工作环节。

区别大概在这里:

对比项过去的语音输入接入 AI 后的语音输入现实影响
核心用途听写文本、辅助输入驱动代码、文档和任务流从输入法变成工作入口
使用位置个人设备、移动端、无障碍场景办公桌、开发环境、协作工具会影响旁边的人
主要限制准确率、口音、噪声隐私、上下文、团队礼仪管理问题会先冒出来

我更在意的是第三列。

一项工具只影响本人时,问题多半是效率和习惯。一项工具开始影响同事时,它就变成了办公规则问题。

办公室可能从安静工位变成低声通话场

原文里最有画面感的一句话,来自一位风投。他形容现在走进一些创业公司办公室,像进入“高端呼叫中心”。

Kim 也对团队表示,未来办公室听起来可能更像销售楼层。这里要说清楚:这不是 Gusto 的正式强制政策,更像是他对办公形态的判断。

冲突很直接。

对使用者来说,口述可能更快。尤其是写提示词、生成草稿、让 AI 改代码时,说一段话的成本低于敲一大段字。

对旁边的人来说,持续低声说话不一定很吵,但很难忽略。键盘声是背景噪音,语言会自动抓住人的注意力。人脑听到半句话,就会想补全下一句。

AI 创业者 Mollie Amkraut Mueller 的家庭办公场景,把这件事说得更具体。她低声对电脑说话后,丈夫感到烦躁。两人深夜工作时,不得不分开坐,或者让其中一人去办公室。

家里尚且如此,办公室只会更复杂。

因为同事之间不只是“忍不忍”。他们还要协作、保密、专注、开会、写代码。一个人的效率提升,可能变成另一个人的注意力成本。

真正受影响的是两类人:重度 AI 使用者和团队管理者

关注 AI 办公工具的科技从业者,接下来要更现实地选工具。

不是看哪个听写软件最酷,而是看它能不能稳定进入自己的工作流:能否接上常用 IDE、文档和任务工具;能否处理代码上下文;能否在嘈杂环境里少出错;能否避免把敏感客户信息、内部代码或会议内容随口送出去。

如果这些问题没想清楚,采购或迁移可以慢一点。先在个人任务、非敏感文档、低风险代码辅助里试,别一上来就把核心工作流都交给语音。

创业公司管理者要做的也不是简单禁用。

更可行的是先定软规则:哪些区域可以持续听写,哪些会议室或电话间给语音 AI 使用;哪些信息不能口述进第三方工具;哪些岗位适合试点,哪些团队要保留安静区。

这类规则不用写成厚手册,但不能全靠默契。默契最怕人多,一多就各行其是。

Wispr 创始人 Tanay Kothari 认为,这种行为以后会像长时间看手机一样正常。这个判断有道理,但手机也不是一天就被社会接受的。

会议静音、公共场合戴耳机、餐桌少刷屏,这些规矩都不是系统自动弹出来的。它们是在一次次打扰之后,被人慢慢磨出来的。

语音 AI 也一样。

接下来最该观察的,不是“键盘会不会死”。这个问题太粗。

更具体的变量有四个:耳机降噪和定向麦克风能否减少外溢;办公室是否愿意增加电话间和安静区;企业安全审查能否跟上语音工具;团队能不能把“低声说话”纳入基本协作礼仪。

目前能看到的趋势是,语音输入正在从个人效率工具走进公共空间。它带来的麻烦,也不是生产率一定下降,而是原来的办公室默认设置不够用了。

以前的默认设置是:工位上打字,会议室里说话。

现在这条线开始模糊。工具让电脑更会听人说话,办公室却还没学会怎么安排这些声音。