苹果在 WWDC 2026 上把一件小事放到了系统入口里:iOS 27 的键盘将内置 AI 听写。
这套能力基于搭载 Gemini 的 Apple Intelligence。用户在不同应用里输入文字时,可以直接语音转写,并让系统修正拼写、标点和大小写。
听写本身不新。iPhone 早就能语音输入。
真正反常的是,过去需要 Wispr Flow、Willow、Monolouge 这类第三方应用来补的体验,现在被苹果塞进了键盘。对开发者来说,压力不是苹果今天就封死赛道,而是入口优势开始换边。
iOS 27 发布了什么:听写变成键盘能力
苹果这次给出的产品位置很明确:不是独立 App,不是单独按钮,而是键盘内的系统级能力。
这意味着用户在邮件、信息、笔记或其他输入框里,都可以调用同一套听写体验。对语音输入来说,这个位置很要紧。因为用户通常不是为了“使用听写应用”而说话,而是为了把一句话尽快变成可用文本。
这套功能目前能看到的重点,是三类基础修正:拼写、标点、大小写。
这些能力听起来不炫,但正好卡在日常使用的门槛上。很多人不用听写,不是因为系统完全听不懂,而是转写之后还要手动收拾。标点乱、大小写错、句子粘在一起,都会让“省时间”变成“多一道工”。
| 维度 | iOS 27 系统级听写 | 第三方 AI 听写应用 |
|---|---|---|
| 入口 | 内置键盘,跨应用使用 | 需要安装、授权,或通过键盘/App 调用 |
| 基础能力 | 转写,修正拼写、标点、大小写 | 转写、清理口头禅、按场景整理文本 |
| 用户收益 | 少切换,轻量输入更顺 | 重度写作和特定格式更可控 |
| 风险点 | 开放边界尚不清楚 | 默认入口优势被压缩 |
我更在意的是这个入口变化。
AI 听写过去的卖点,常常是“比系统自带更聪明”。但当系统自带能力开始补齐,第三方就不能只证明自己聪明。它们还要证明,用户多装一个应用、多走一步,仍然划算。
第三方真正被挤压的是默认路径
Wispr Flow、Willow、Monolouge 这类应用过去能成立,是因为手机原生听写不够好用。用户愿意为了更干净的转写、更自然的格式整理,接受额外配置。
苹果把 AI 听写放进键盘后,轻量用户的选择会变简单。
如果只是回消息、写短邮件、记几句想法,很多人会先用系统能力。它就在输入框旁边,不需要切 App,也不需要重新适应流程。对高频工具来说,少一步就是很大的优势。
第三方并不会因此立刻失去价值。它们仍可能在长文本、写作模板、行业词汇、会议纪要、团队知识库衔接上做得更深。
但“比系统方便”这句话会更难讲。
这里还有一个现实约束。iOS 26.4 曾增加第三方键盘类听写应用的启用步骤。原文没有说苹果封杀了这些应用,也不能据此断言第三方会被完全替代。
可入口摩擦一旦增加,语音输入这种工具就会变脆。用户不是每天都愿意研究设置。团队采购这类工具时,也可能先延后决策,等 iOS 27 正式落地后再看是否还需要单独付费或迁移。
对开发者更实际的动作,是调整卖点。
轻量转写不能再当护城河。更稳的方向,是把产品做成“系统听写之后的第二步”:比如长内容整理、专业术语、固定写作格式、多人协作和知识库连接。
接下来要看什么:苹果给不给同样顺的工作流
目前最关键的问题还没有答案:iOS 27 会不会改善第三方听写开发者的工作流。
原文只说尚不清楚。这里不能替苹果下结论,也不能把 Gemini 支持扩写成苹果全面转向谷歌 AI 生态。能确定的只是,苹果这次在 Apple Intelligence 的听写能力里用了 Gemini 支撑。
可参照的是 Google。Google 此前已经在 Gboard 中推出过由 Gemini 驱动的类似系统级能力。两家都把 AI 听写往键盘里放,至少说明一件事:语音输入正在从创业公司特色功能,变成手机系统的基础配置。
接下来最该观察三件事。
| 观察点 | 为什么重要 | 对谁影响最大 |
|---|---|---|
| 第三方调用路径 | 决定第三方能否接近系统级顺滑 | AI 听写应用开发者 |
| 语言与地区支持 | 决定普通用户能否直接替换旧工具 | 跨语言用户、生产力工具用户 |
| 隐私与数据处理说明 | 决定团队和企业是否敢把输入交给系统 | 团队采购者、企业用户 |
如果苹果只给自家听写最短路径,第三方就要往深水区走。它们需要让用户为了更专业的结果留下来,而不是为了基础转写留下来。
如果苹果给第三方更顺的工作流,局面会缓和一些。但即便如此,系统自带能力也会吃掉一批轻量需求。这是入口下沉后的自然结果。
所以这件事对普通用户是好消息。少装一个应用,也可能得到更干净的语音输入。
对第三方开发者则是提醒:别再只和同类 App 比模型、比转写速度。真正的对手,已经变成用户每天都要打开的那块键盘。
