The Verge 作者 Antonio G. Di Benedetto 在 macOS 27 Golden Gate 开发者测试版上试用了新版 Siri AI 约 24 小时。
这个前提很重要。它不是最终版,也不是长周期评测。作者甚至无法确认测试机上的本地文件和文件夹是否已经完成索引。
但这 24 小时已经暴露出一个关键问题:Siri AI 在 Mac 上确实更有用,可一旦进入桌面工作流,它就没那么稳了。
手机上的 Siri 更像查询助手。Mac 上的 Siri,用户期待它能整理文件、读表格、操作软件、跨应用完成任务。差别就在这里。
能读文件和截图,但结果还要复核
新版 Siri AI 最有价值的变化,是开始碰到 Mac 的本地内容。
在测试中,作者可以通过 Finder 右键菜单,或 Spotlight 里的 Ask Siri,让 Siri 分析本地截图和文件。它能看 Geekbench、Cinebench、PugetBench 等跑分截图,也能把多张截图里的结果汇总成表格。
这比旧 Siri 强很多。旧 Siri 常让人感觉停在“查天气、设闹钟、找应用”的层面。新版至少开始接近 Mac 用户每天处理的材料:截图、文件、表格、文件夹。
问题是,它还不够准。
作者让 Siri 汇总跑分截图时,它多数时候能识别单核、多核和 GPU 分数。但截图一混杂,或者 Cinebench 页面里出现 CPU 排名数据,它就可能取错数。它还曾把单核和多核数据混在一起。
这类错误对闲聊没什么,对工作有成本。
做评测的人不能直接把它的表格发出去。采购人员不能拿它的汇总当依据。研究、财务、测试记录这类场景,也必须人工复核。
| 场景 | Siri AI 做到了什么 | 主要限制 | 更现实的用法 |
|---|---|---|---|
| Finder / Spotlight 分析截图 | 能识别跑分并生成表格 | 可能取错数据 | 初步整理,人工校验 |
| 多类跑分截图混合 | 能读出部分分数 | 会混淆单核、多核或排名数据 | 不适合直接出结论 |
| Google Sheets 屏幕分析 | 能看屏幕可见内容 | 看不到未显示区域 | 只适合小范围查看 |
| Excel 文件分析 | 可读取完整文件 | 仍可能读错字段 | 可辅助检查,不可替代审稿 |
这里的判断很简单:新版 Siri AI 已经能减少一部分机械整理,但还不能减少责任。
你可以让它帮忙起草表格。你不能把最终准确性外包给它。
能打开应用,不等于能完成任务
Mac 用户真正想要的,不只是“帮我找文件”。
作者测试了一个更接近专业场景的任务:让 Siri 或 Apple Intelligence 自动运行 Geekbench、Cinebench,截图记录结果,并重复三次。
这很典型。跑分、截图、记录、重复执行,都很琐碎,也很适合被自动化接手。
结果并不理想。
Siri AI 可以启动应用,但不能深入执行应用内操作。它能把软件打开,却没能稳定完成“开始测试、等待结果、截图、记录”的链条。
Shortcuts 里新增的 Apple Intelligence 自动化也没补上这个缺口。它生成的 Geekbench 自动化会打开软件并截图,却忘了真正运行测试。Cinebench 自动化更尴尬,直接把“等待你运行测试”写成一个步骤。
这说明新版 Siri 现在更像“会看屏幕的助手”,还不是“能替你干活的操作员”。
这也不是苹果独有的难题。桌面系统里的 AI 助手普遍卡在同一层:能理解你的意图,能给建议,能打开软件,但碰到第三方应用里的按钮、状态变化、权限弹窗和异常处理,就很难稳定执行。
这里需要的不只是大模型,还需要应用接口、权限体系和开发者配合。苹果的 App Intents 如果继续扩展,可能会改善这件事。但从这次测试看,还不能说 Siri AI 已经能自动化专业工作流。
对两类人影响最直接。
做 Mac 评测、测试和内容生产的人,可以把新版 Siri 当作整理助手试用,比如汇总截图、草拟表格、检查文件。但关键数据仍要自己过一遍。
公司里想把 Apple Intelligence 接进固定流程的团队,也不该急着迁移。更稳妥的做法,是等 macOS 27 更接近正式版,再看第三方软件有没有开放足够的 App Intents。
Mac 放大了苹果生态边界
新版 Siri 在 iPhone 上更容易显得顺手,因为很多数据天然在苹果自家应用里。
照片在 Apple Photos,聊天在 Messages,日程在 Calendar,邮件在 Mail。Siri 要找内容,路径比较短。
Mac 不一样。
专业用户的工作材料经常分散在第三方工具里。照片可能在 Lightroom Classic,手机相册可能同步到 Google Photos,聊天可能在 Signal 或 Slack,数据可能在 Google Sheets、Excel、Notion 或本地文件夹。
这次测试里,Siri 能从 Apple Photos 和 Messages 里找猫或婴儿照片。但它没有覆盖 Signal、Google Photos,也没有识别 Lightroom Classic 目录里的数千张本地图片。
那些图片虽然在 Pictures 文件夹中,但作者无法确认原因。可能是本地索引还没完成,也可能是 Siri 现阶段对这类第三方生态触达不足。现在只能谨慎看待,不能下最终结论。
屏幕视觉理解也有桌面限制。
Siri 可以看屏幕,但只能看见当前可见区域。Google Sheets 里没有显示出来的长表格,它就看不到。把表格下载成 Excel 文件再分析,覆盖面会好一些,但准确性仍然不够让人放心。
这就是 Mac 比 iPhone 更难的地方。
iPhone 的核心任务更集中,应用路径也更受控。Mac 的价值恰恰在自由、复杂和跨应用。用户把它当工作台,而不是一个封闭入口。
所以我更在意的不是 Siri 会不会回答得更自然,而是三个更硬的变量:
- macOS 最终版是否会清楚显示本地索引状态,别让用户猜它到底读完没有;
- 第三方应用会开放多少 App Intents,让 Siri 不止能打开软件,还能执行动作;
- 文件分析和屏幕理解的错读率能不能降下来,尤其是表格、截图和可审计数据。
如果这三件事没有改善,Siri AI 在 Mac 上就会长期停在“帮一点忙”的位置。
它会有用。尤其适合整理截图、找苹果应用里的内容、做初步归纳。
但对依赖 Mac 处理跨应用任务的人,现在的策略应该是保守的:可以试,不要迁;可以辅助,不要托付。
