ZLUDA 发布 Version 6,把 2026 年上半年的更新打包成一个主要版本节点。这个开源项目的定位很明确:让未修改的 CUDA 应用运行在非 NVIDIA GPU 上,主要吸引 AMD GPU 用户和关注 CUDA 兼容层的开发者。

这次更新的意义不在于 ZLUDA 突然变成成熟商用品,也不是宣称覆盖所有 CUDA 应用。Version 6 与 6-preview.79 相同,主版本号只是标记阶段性进展。真正的变化,是它把可尝试的场景从原有计算负载,扩到老游戏 PhysX、Blender 纹理和部分机器学习工作流。

Version 6 的核心是兼容面扩大,不是一次功能“大跃进”

CUDA 长期是 NVIDIA GPU 的护城河。ZLUDA 试图绕开这道墙,让应用不改代码也能在非 NVIDIA GPU 上运行。这类项目的难点不只是 API 对齐,还包括性能库、编译器行为、驱动差异和应用各自的边角用法。

这次更新可扫读成四条线:

项目变化对用户的实际影响判断
PhysX新增 32-bit PhysX pre-alpha,PR #651 尚未合并部分老游戏可尝试在 AMD GPU 上开启 PhysX 效果只适合愿意编译源码的玩家
Blender增加基础纹理支持Blender 当前所需用例已可覆盖是可见度最高的新场景之一
Windows改善缺库提示、安装指引,zluda.exe 自动加载性能库少踩环境配置坑不是替用户打包完整 ROCm
ML/PyTorch增加指令、修复编译器问题、改进性能库某些 PyTorch trace 更容易跑通仍需按具体模型验证

PhysX 最容易被误读。这里支持的是 32-bit PhysX pre-alpha,不是 64-bit GameWorks。作者也明确说,流体模拟还有异常,Steam 游戏加载 ZLUDA 的方式也不理想。PCGamingWiki 的 PhysX 游戏列表把 32-bit PhysX 和 64-bit GameWorks 混在一起,用户照单测试,很容易得出错误期待。

更值得尝试的场景,是老游戏、Blender 和部分 ML 负载

对普通 AMD 玩家,最现实的入口是老游戏。比如原文展示了 2010 版《Mafia II》内置 benchmark 在 AMD GPU 上开启 PhysX 的截图。它不保证游戏库大面积可用,但对还在折腾经典 PC 游戏的人,意义很具体:过去被 NVIDIA 硬件绑定的碎片、火焰等效果,至少出现了松动。

Blender 的价值更偏创作者。纹理支持仍很基础,但已经覆盖 PhysX 和 Blender 当前需要的用例。相比老游戏,Blender 用户更关心能不能稳定完成一次渲染、能不能复现项目文件;这部分目前还不宜直接用于严肃生产,只适合作为替代路径测试。

机器学习场景则更复杂。ZLUDA 收到 PyTorch 用户 trace 后,补了多组指令、编译器修复和性能库改动。但 ML 不是“能启动”就等于“能用”,模型算子、库版本、Windows/ Linux 环境都会影响结果。和 AMD 官方 ROCm 相比,ZLUDA 的优势是尝试运行未修改 CUDA 应用,短板是兼容边界更碎,问题定位成本也更高。

回到个人周末项目后,最大变量是维护节奏

原文最关键的一句,是 ZLUDA 已不再有商业资助,回到作者的周末项目。这个组织变化解释了为什么此前不在路线图内的纹理、PhysX、Windows 改善突然出现:优先级从商业可交付,转向作者觉得有趣的方向。

这对用户不是坏消息,也不是纯好消息。好处是路线更灵活,老游戏、Blender 这类“商业上未必优先”的场景被捡了起来;代价是发布时间、问题响应和长期维护都更难承诺。Violet 成为 Developer Emeritus,也说明项目人力结构已发生变化。

接下来最该看三件事:PR #651 何时合并进 preview build;Windows 上 ROCm 性能库安装与加载能否继续简化;PyTorch 用户提交的 trace 能否转化为更稳定的兼容清单。对想拿它干活的人,当前判断应当保守:可以试,不该押;适合验证,不适合替代正式工具链。