Mac 也能跑微软 TRELLIS.2：一个小型开源项目，戳中了本地 AI 3D 生成的真需求

人工智能 2026年4月20日

核心摘要 Summary

开发者 Shivam Kumar 在 GitHub 发布了 trellis-mac，把原本依赖 CUDA 的微软 TRELLIS.2 移植到 Apple Silicon，可在 M1 及以上 Mac 上原生运行图像转 3D。
它真正重要的地方，不是“Mac 终于能跑大模型”这句老话，而是把一类原本锁定英伟达显卡的 3D 生成工作流，拉回了大量设计师和独立开发者最常用的硬件平台。
但它也不是大众消费级突破：24GB 以上统一内存、约 15GB 模型权重、单次生成约 3.5 分钟，说明这更像一把可用的工程工具，而不是已经成熟的桌面产品。

内容导图 Mind Map

开源 TRELLIS 移植

TRELLIS.2 模型摆脱 CUDA 绑定

核心移植动作

逐块改写底层算子以适配 MPS

替换计算组件

Flash attn 改为 PyTorch SDPA

修复硬编码

清理代码中写死的 .cuda() 调用

完善资产导出

新增提取顶点颜色功能

终端设备解绑

独立创作者免于增购英伟达工作站

验证与原型

契合独立团队本地出样验证需求

开发测试

打通非 CUDA 环境复现实验通路

硬件隐性约束

运行条件苛刻且生成耗时较长

内存门槛高

必须 24GB 以上统一内存设备

存储与授权

需下载 15GB 权重并获取授权

工程化短板

结果仅堪用距离生产线商用极远

后处理缺失

孔洞填充与纹理导出仅作 Stub

算子生态羸弱

复杂 3D 算子推理兼容性尚存波动

一个名为 trellis-mac 的开源项目，最近把微软的图像转 3D 模型 TRELLIS.2 搬到了 Apple Silicon。按照项目说明，它不再依赖 NVIDIA GPU 和 CUDA，而是改用 PyTorch 的 MPS 后端，让 M1 及以上的 Mac 也能直接生成 3D 网格。作者给出的实测结果是：在 M4 Pro 上，单张图片可在约 3.5 分钟内生成 40 万以上顶点的 mesh，并导出带顶点颜色的 OBJ 和 GLB 文件。

这件事的价值，不在于它把 Mac 变成了新的 AI 算力王者。Mac 依然不是训练大模型的主战场，也很难替代配备高端英伟达显卡的工作站。真正有分量的地方在于，它把“能不能做”变成了“虽然慢一点，但现在真能在本机做”。对 3D 内容生产来说，这个门槛变化很现实。

一个小项目，补上了 Mac 在 3D 生成链条里的缺口

TRELLIS.2 原本是微软推出的图像到 3D 生成方案，但它背后依赖多种 CUDA 专属组件。trellis-mac 做的不是简单包装，而是逐块替换：例如把 flash_attn 换成 PyTorch SDPA，把稀疏 3D 卷积和网格提取改写为纯 PyTorch 或纯 Python 方案，并修补代码里大量写死的 .cuda() 调用。最新一次提交还加入了“从体素属性提取顶点颜色”，这意味着导出的模型不只是结构可看，表面颜色信息也更接近可直接使用的资产。

这类移植最难的地方，从来不是把程序“跑起来”，而是把 CUDA 世界里高度优化、默认依赖 GPU 内核的环节，改造成性能还能接受的替代实现。GitHub 页面里只有 3 次提交、6 个 Star、1 个 Fork，规模很小，但它做的是开发者群体长期遇到的硬问题：很多生成式 3D 项目在论文和演示里很炫，落到设备兼容性上却几乎等于“默认你有英伟达卡”。

为什么它在现在有意义：AI 3D 正从研究演示走向个人生产工具

过去两年，图像生成已经从云端 API 走向本地化部署，3D 生成则慢得多。原因很简单：它更吃显存、更依赖复杂后处理，工具链也更碎。苹果这几年靠 M 系列芯片把统一内存和本地推理能力做起来，很多设计师、iOS 开发者、独立创作者本来就长期在 Mac 上工作，但一到 3D 生成环节，常常还得借云 GPU、远程 Linux 机或者额外买一台 Windows 工作站。

trellis-mac 之所以有现实意义，是因为它削掉了这道额外采购。对一些人来说，这不是性能问题，而是流程问题：能不能在现有机器上试验概念、快速出一个可导入 Blender、Unity 或网页 3D 查看器的模型。项目要求里写得很清楚：推荐 24GB 以上统一内存，4B 模型首次运行还要下载约 15GB 权重，并且需要登录 Hugging Face 获取 gated model 权限。换句话说，它降低的是硬件门槛，不是把整个使用门槛都抹平了。

公开说法是“原生运行 Mac”，行业现实则是：你还得有一台内存够大的 Apple Silicon 设备，还得处理模型授权、环境安装和依赖补丁。它更像开发工具，不是 App Store 式软件。

和现有方案相比，它替代了什么，没替代什么

如果把目前常见的 3D 生成路径放在一起看，trellis-mac 所处的位置其实很明确：它是“本地可用的开源工程解法”，不是“最快”也不是“最省心”。

方案	典型硬件	成本结构	速度/易用性	适合谁
trellis-mac	Apple Silicon Mac，建议 24GB+ 内存	复用现有 Mac，软件开源	安装折腾，生成约分钟级	独立开发者、设计师、研究者
原版 TRELLIS.2 / CUDA 路线	NVIDIA GPU 工作站	额外买卡或租机器	通常更快，兼容性更成熟	追求效率的专业用户
云端 3D 生成服务	无本地高配要求	按次或订阅付费	最省事，但可控性较低	轻量需求、非技术用户

如果你是普通用户，最现实的变化并不是“今天就能随手玩 3D AI 了”，而是未来 Mac 上这类工具会越来越多。短期内，真正受益的人群更集中：

已有高配 Mac 的设计师，少一次远程算力切换
做原型验证的独立团队，可以先本地出样
研究者能在非 CUDA 环境复现实验流程
iOS/macOS 开发者更容易把 3D 生成接进现有工作机

目前的短板也很直接：能生成，不等于已经能上生产线

项目作者已经明确标出几项仍然缺失或被“跳过”的能力，比如 cumesh 相关的孔洞填充、网格简化，以及 nvdiffrast 对应的可微光栅化纹理导出，目前都只是 stub。说得直白一点，这意味着生成结果虽然已经能导出 OBJ、GLB，但在资产清理、纹理质量、后续优化上，离成熟商用流水线还有距离。40 万以上顶点的 mesh 听起来很细，但顶点数高不自动等于更适合游戏、AR 或移动端部署，很多场景反而还要再做减面。

另一个容易被忽略的限制，是 Apple 的 MPS 生态还远没达到 CUDA 的成熟度。PyTorch 在 Mac 上做推理已经可用，但一旦涉及稀疏计算、复杂 3D 算子和大模型组合，性能波动和兼容性问题仍会出现。这也是为什么很多开源项目嘴上支持 Mac，实际 README 往往只给 Linux + CUDA 路线。trellis-mac 的出现说明这个局面正在松动，但还谈不上已经被改写。

结论 Conclusion

我的判断是，trellis-mac 的新闻价值高于它当前的市场体量。它未必会变成一个爆红项目，却准确踩中了生成式 3D 的一个真实痛点：创作者手里最常见的机器，过去往往跑不了最前沿的 3D 模型。接下来更值得观察的，不是这个仓库能涨多少 Star，而是会不会有更多项目沿着这条路，把 CUDA 独占能力逐步改写成跨平台版本。如果这种移植开始成规模，Mac 在 AI 内容生产里的角色会从“辅助终端”变成“够用的本地主机”；如果没有后续维护，它就会停留在一次漂亮但脆弱的个人工程展示。

TRELLIS.2trellis-macApple Silicon图像转3D本地AI生成PyTorch MPS微软MacCUDA迁移Shivam Kumar