AI芯片的成本压力正在从“谁有最强逻辑芯片”扩展到“谁拿得到足够多、足够便宜的HBM”。Epoch AI在5月21日发布的估算显示,2024年一季度到2025年四季度,NVIDIA、AMD、Google和Amazon设计的AI芯片中,HBM内存占总组件支出的比例从52%升至63%。该数据按产量加权,并非厂商官方披露。
这组数字的重要性在于,它把AI算力竞争中一个常被低估的环节推到台前:先进制程GPU或ASIC仍然关键,但在大模型训练和推理集群里,高带宽内存已经成为更大的成本项。对云厂商来说,2026年的资本开支压力可能不只来自买更多芯片,还来自同一颗芯片里的内存更贵。
HBM成为最大成本项,不是偶然涨价
HBM之所以占比升高,来自AI芯片架构本身的变化。大模型需要更高内存带宽来喂饱计算单元,NVIDIA H100、H200、B200,AMD MI300系列,以及Google TPU、Amazon Trainium这类自研加速器,都在把更多预算花到靠近计算核心的高带宽内存上。
Epoch AI估算的组件口径包括HBM、3至5纳米逻辑芯片、TSMC CoWoS先进封装,以及基板、电源等辅助组件。这里讨论的是“AI芯片组件成本”,不能直接等同于整张加速卡、服务器或数据中心总成本。
| 项目 | 2024年Q1占比 | 2025年Q4占比 | 判断 |
|---|---|---|---|
| HBM内存 | 52% | 63% | 最大成本项继续扩大 |
| 逻辑芯片 | 约14% | 约13% | 占比基本稳定,不代表绝对成本下降 |
| 先进封装 | 19% | 15% | 被HBM挤压占比 |
| 辅助组件 | 15% | 约10% | 相对权重下降 |
这张表的含义很直接:AI芯片成本结构里,最紧的螺丝不一定在GPU逻辑裸片,而可能在HBM堆栈和相关供应安排上。
组件支出两年翻倍多,HBM贡献了最大增量
从绝对金额看,变化更明显。Epoch AI估算,四家芯片设计方相关AI芯片组件总支出从2024年的约220亿美元增至2025年的约520亿美元;其中HBM支出从约120亿美元增至约320亿美元,贡献了约200亿美元增量。
横向看,这也解释了为什么SK hynix、Samsung、Micron的HBM产能和良率,正在成为云计算资本开支会议上的关键词。过去讨论AI芯片,市场习惯盯NVIDIA GPU交期、TSMC先进制程和CoWoS产能;到H100向H200、B200过渡时,内存容量和带宽对整机性能的影响更直接,HBM议价权也随之上升。
这不等于逻辑芯片不重要。逻辑芯片占比稳定在13%左右,说明它仍是高价值环节。只是当HBM价格上行、供应偏紧时,云厂商扩容集群的边际成本更容易被内存牵动。
云厂商2026年预算要盯组件价格,而不是只盯芯片数量
受影响最直接的是AI基础设施采购团队和云厂商财务部门。微软已在2026财年约1900亿美元资本开支展望中提到,约250亿美元来自更高组件价格;Meta也把2026年资本开支区间上调100亿美元,并提到组件价格上涨压力。
这会改变采购动作。云厂商可能更早锁定HBM供应,与内存厂签更长期协议;自研芯片团队也会在性能、内存容量、封装复杂度之间做更细的取舍。对AI创业公司和企业客户来说,影响会更间接:云服务商若承担更高硬件成本,部分训练或推理价格未必立刻下降,折扣也会更挑客户和用量。
这份估算也有边界。HBM单价、逻辑裸片成本、CoWoS价格、季度产量和芯片组合都会改变最终占比。比如NVIDIA、AMD通用加速器与Google、Amazon自研芯片的出货结构不同,权重变化会影响整体结果。眼下能确认的是方向:2026年若HBM仍供不应求,AI算力扩张的约束会更多写在内存供应表上,而不是只写在GPU发布会上。
