AMD想撬动CUDA护城河，ROCm这次不再喊口号

人工智能 2026年4月13日

在AI算力几乎被CUDA定义的当下，AMD正试图用ROCm一点点啃下开发者生态这块最硬的骨头。它还远谈不上颠覆英伟达，但如果ROCm真能把“能跑”变成“好用”，GPU市场最关键的那场战争，才算真正开始。

CUDA之外，终于有人认真修路了

在AI热潮席卷全球的这几年，GPU圈最扎眼的事实不是芯片参数，而是生态垄断。很多企业采购加速卡时，表面上买的是英伟达GPU，实际上买的是一整套CUDA世界观：工具链、框架适配、模型支持、社区经验、调优文档，甚至连工程师的职业惯性都被打包带走了。你可以不喜欢这种绑定，但很难否认，CUDA已经成了AI计算的“默认语言”。

所以，AMD谈ROCm挑战CUDA，真正难的从来不是做出一块性能不错的GPU，而是让开发者愿意迁移、敢于迁移、并且迁过去以后不后悔。EE Times这篇文章里那个很朴素的表述——“one step after another”，翻成大白话就是：别指望一夜翻盘，先把路一段一段铺平。这句话听起来没什么气势，却可能比任何“生态逆袭宣言”都更接近现实。

坦率说，过去几年ROCm给外界留下的印象，常常是“有潜力，但不好使”。支持列表复杂，版本兼容性让人头大，安装体验时常像一场耐心测试，很多开发者一边嘴上说支持开放生态，一边身体很诚实地继续回到CUDA怀抱。不是因为他们不理想主义，而是项目上线有 deadline，老板不为理想买单。ROCm如果想真正站稳，就必须解决这个最现实的问题：工程效率。

AMD的机会，不在口号，而在英伟达太强了

听上去有些反直觉，但AMD今天最大的机会，恰恰来自英伟达的成功。因为当CUDA和英伟达GPU几乎成为AI基础设施代名词时，整个行业也开始感受到另一面：价格高、供应紧、议价权失衡、技术路线过于单一。大型云服务商、超算中心、主权AI项目，乃至一些不愿把命门完全交给单一供应商的大企业，都在寻找第二选择。

这就是ROCm存在的战略价值。它不只是一个软件栈，而是AMD试图把硬件能力转化为“可部署生产力”的桥梁。没有这座桥，MI300这类加速卡就算纸面性能再漂亮，也很难吃到真正的大规模AI训练和推理红利。过去半导体行业已经反复证明：硬件领先可以赢一时，生态成熟才能赢十年。英特尔当年在CPU时代深谙此道，今天的英伟达则把这套打法在GPU和AI上演到了极致。

AMD之所以值得关注，不是因为它已经赢了，而是它终于开始用比较务实的方式承认：这不是一场“新品发布会式”的战斗，而是一场基础设施战争。开发者不需要豪言壮语，他们需要的是PyTorch版本能顺利装上，训练脚本别莫名报错，调试工具别像半成品，性能分析别只能靠猜。说到底，生态竞争的本质，是减少开发者的时间损耗。

这也是为什么AMD近来的动作比以前更像“补生态短板”，而不是单纯比拼TFLOPS。你会发现，无论是主流AI框架支持、对模型库的兼容、还是和云厂商及开源社区的联动，ROCm都在努力把自己从“可选项”变成“可工作的选项”。这一步看着不性感，却最关键。

开源是ROCm的武器，但开源从来不是免死金牌

很多人一提ROCm，就自然联想到“开源对封闭”。这个叙事很动听，也确实戳中了不少开发者的情绪点。尤其在AI基础设施越来越像公共资源的今天，行业对开放标准、可移植性和供应链安全的呼声越来越高。理论上，ROCm比CUDA更容易获得这部分支持。

但现实没那么浪漫。开源软件并不会自动变成好软件，开放生态也不会自动长出成熟体验。很多企业用户最在意的，根本不是“代码仓库开不开”，而是“出了问题有没有人管、升级会不会炸、性能能不能稳定复现”。如果一套平台虽然开放，却始终让人踩坑，那它给企业带来的不是自由，而是不确定性。

这也是ROCm眼下面临的核心考验：如何把“开放”变成“可靠”。从技术史来看，真正成功的开放生态往往都经历过一个尴尬阶段——理念很先进，体验很粗糙。Linux当年也是如此，直到企业级支持、工具链和商业发行版逐渐完善，它才真正改写服务器市场。ROCm有没有机会走上类似路径？我认为有，但前提是AMD愿意继续投入那些看起来不够耀眼的脏活累活：文档、驱动、编译器、框架适配、社区响应、长期维护。

换句话说，ROCm不能只做“反CUDA联盟”的旗帜，它得先成为一个让工程师愿意在周五晚上部署而不骂人的平台。这听起来像玩笑，其实非常严肃。技术圈很多胜负，并不是输在架构，而是输在周末加班时的用户心情。

真正的胜负手，在大客户机房里，也在普通开发者手里

如果把视线拉近，你会发现ROCm的命运其实掌握在两类人手中：一类是超大规模客户，另一类是普通开发者。

前者决定体量。云计算巨头、国家实验室、大型模型公司、整机厂商和服务器OEM，他们一旦把AMD GPU纳入大规模部署，ROCm就能迅速积累真实工作负载、兼容性反馈和市场信心。过去一段时间，AMD在这些客户中的能见度明显提升，这说明行业确实不想把所有筹码压在单一厂商身上。尤其在训练成本高企的背景下，只要AMD能给出“足够好且更划算”的方案，市场就愿意给它窗口期。

后者决定生命力。一个生态系统真正长出来，不是靠几份采购合同，而是靠无数开发者在GitHub、论坛和实验室里反复使用、吐槽、修补、推荐。CUDA最可怕的地方，从来不只是英伟达投入了多少钱，而是无数开发者已经把它当成了肌肉记忆。今天学生做AI作业默认是CUDA，创业公司写第一版训练代码默认是CUDA，研究论文的复现实验环境也大多默认CUDA。这种“默认值”一旦形成，后来者要改写它，就必须把门槛降到极低。

所以，ROCm未来最重要的指标不只是跑分，也不是发布会上那几张对比图，而是一个更朴素的问题：一个会PyTorch的工程师，能否在不过度折腾的情况下，把现有工作流迁到AMD平台上？如果答案逐渐从“勉强能”变成“其实还不错”，再变成“没什么区别”，那市场格局就会开始松动。生态壁垒往往不是被正面炸开的，而是被一次次“迁移成本下降”慢慢侵蚀的。

这场仗不会速胜，但它必须有人打

从行业角度看，ROCm的价值甚至不完全属于AMD。它更像整个AI计算产业链的一次必要制衡。没有竞争者，CUDA会更强；但也因为没有竞争者，整个行业会更脆弱。价格、创新节奏、标准制定权、人才培养路径，都会被单一体系牵着走。对客户来说，这未必是健康局面；对开发者来说，也不见得是长久之计。

当然，ROCm也不能被神化。它离“CUDA替代品”还有距离，尤其在生态深度、开发者心智和软件成熟度上，英伟达依旧领先明显。AMD现在更像在打一场持久战的前半段：先补齐工具链，再争取头部客户，再慢慢扩大开发者基础。这个过程可能漫长得让人不耐烦，但基础软件从来就不是靠激情冲刺赢下来的。

我反而觉得，EE Times标题里的那句“one step after another”很有意思。在一个习惯了讲颠覆、讲爆款、讲弯道超车的科技行业里，这种近乎克制的表达显得有点老派，却也因此更可信。ROCm真正要挑战的不是某一代英伟达GPU，而是十几年积累起来的软件惯性和产业共识。这种级别的护城河，没有捷径。

未来两三年，AI算力市场很可能进入一个微妙的新阶段：硬件不再只是拼绝对性能，而是拼“全栈可用性”；客户也不再只看芯片参数，而是看供应弹性和软件迁移成本。谁能把这些看不见的细节做到位，谁才有资格谈下一轮格局重写。AMD现在至少做对了一件事：它终于明白，挑战CUDA不是喊得更大声，而是把每一步都走稳。这个认知本身，就是一种进步。"

Summary: 我的判断是，ROCm短期内不太可能把CUDA从王座上拉下来，但它完全有机会成为AI基础设施里真正有分量的“第二极”。一旦AMD持续改善开发体验，再叠加大客户导入和供应链多元化需求，市场就会从“只有CUDA能用”转向“CUDA最好，但ROCm也能打”。这不是一场戏剧性的逆转，而是一次缓慢却关键的权力再平衡。对整个行业来说，这种变化越早发生越好。

ROCmCUDAAMD英伟达GPU开发者生态AI算力工具链框架适配生态垄断