x86 Ecosystem Advisory Group 在 2026 年 6 月 15 日发布了 AI Compute Extensions(ACE)v1 公开规范。

这次官方给出的是可下载的规范 PDF。不是新处理器发布。也没有首发厂商、上市时间、性能倍数或能效数据。

有意思的地方在这里:ACE 不是又一份普通指令文档。它把机器学习里最常见、也最吃 CPU 侧补强的两件事摆上台面——矩阵乘法内核,以及低精度数据格式。

我的判断很简单:ACE 是 x86 在 CPU 侧补 AI 计算缝隙,不是去取代 GPU 或 NPU。

ACE v1 定义了什么:矩阵、低精度、状态搬移

ACE v1 的初期重点,放在机器学习负载常用的矩阵计算上。

规范提到的关键机制包括 ACE tile/register state、block scale registers,以及 AVX 输入与 ACE tile 状态之间的数据处理和搬移。也就是说,它关心的不只是“多一条算术指令”,而是怎样把矩阵计算需要的状态组织起来。

这点很关键。

AI 负载里,矩阵乘法是底层高频操作。低精度格式则关系到推理、部分训练环节和数据搬运成本。CPU 如果只靠传统标量或普通向量路径硬扛,效率和表达能力都不够顺手。

ACE 试图补的就是这块。

维度ACE v1 里能看到的方向我的判断
计算核心面向矩阵乘法内核定义能力补 CPU 侧 ML 基础算子短板
数据格式面向机器学习常用低精度格式降低推理和前后处理里的格式负担
状态机制引入 ACE tile/register state、block scale registers不是普通向量指令的小修小补
数据通路支持 AVX 输入与 ACE tile 状态之间处理和搬移重点是接入现有 x86 软件生态
与 AVX10AVX10 框架下另有格式转换操作ACE 是增强,不是替代 AVX/AVX10

这也解释了 ACE 和 AVX、AVX10 的关系。

它不是推倒 AVX 另起炉灶。更像是在 AVX 向量体系旁边,补上面向 AI 矩阵和低精度格式的专门能力。老树发新枝,前提是根还接在原来的软件土壤里。

它补的是 CPU AI 的缝隙,不是和 GPU/NPU 抢主舞台

过去几年,AI 计算的主舞台在 GPU 和 NPU。

GPU 负责大规模并行矩阵计算。NPU 更多出现在终端和专用推理场景。CPU 没有退出 AI,但角色常常是调度、控制流、预处理、后处理,以及一些不适合搬到加速器上的碎片化计算。

ACE 的位置就在这里。

它更像是在回答一个实际问题:当 AI 任务不值得启动外部加速器,或者需要和通用代码紧密交织时,x86 CPU 能不能更顺手地处理矩阵和低精度格式?

这不是新问题。

x86 过去靠 SSE、AVX、AVX-512 一路扩展向量能力。Intel AMX 也已经把 tile 思路带进部分服务器 CPU。Arm 体系里,也有 SVE、SME 这类面向向量和矩阵能力的路线。

ACE v1 的不同点在于,它来自 x86 Ecosystem Advisory Group 的公开规范表达,而不是某一家公司的单独产品说明。这个区别不小。

对软件生态来说,公开规范的价值是提前做抽象。编译器、运行时、数学库和推理框架可以先思考接口边界,而不是等某一款 CPU 出来后再被动适配。

但限制也必须说清。

规范发布只说明接口被定义,不说明所有 x86 CPU 都会支持。它也不等于 GPU,不等于 NPU,更不能推出“专用 AI 加速器会被取代”。目前能看到的,只是 x86 阵营在 CPU 侧把 AI 计算能力补得更完整。

对开发者和技术决策者:现在该改路线图,不该改采购单

最相关的两类人,是芯片与系统软件开发者,以及关注 CPU AI 加速生态的技术决策者。

他们关心的不是同一个问题。

对象现在该做什么现在不该做什么
芯片与系统软件开发者评估 ACE 状态保存/恢复、编译器后端、数学库和推理库抽象不要把 ACE 当成已经普遍可用的硬件能力
技术决策者要求供应商说明 ACE 支持路线、库适配计划、回退策略不要仅凭规范发布调整采购计划

对系统软件开发者来说,ACE 真正麻烦的地方不只是新增指令。

操作系统要不要保存和恢复 ACE 状态?上下文切换成本怎么处理?编译器如何生成代码?BLAS、推理库和运行时如何在 AVX、AVX10、ACE、GPU、NPU 之间选路径?这些问题决定了 ACE 会不会变成可用能力。

对企业技术决策者来说,现在更应该问供应商三个问题。

第一,哪些未来 CPU 会实现 ACE,时间表能不能说清。第二,主流编译器、内核、数学库和 AI 框架什么时候适配。第三,如果目标机器不支持 ACE,软件栈有没有稳定回退路径。

这比听性能口号更有用。

因为官方目前没有给出吞吐、延迟、能效数据,也没有公布支持厂商名单和首发处理器。没有这些信息,就很难做采购层面的判断。

接下来最该观察的,不是宣传词,而是三件硬事:处理器实现、工具链支持、框架调度。

只有这三环接上,ACE 才会从一份 PDF 变成开发者能调用、企业能评估的真实能力。