一个名为 trellis-mac 的开源项目,最近把微软的图像转 3D 模型 TRELLIS.2 搬到了 Apple Silicon。按照项目说明,它不再依赖 NVIDIA GPU 和 CUDA,而是改用 PyTorch 的 MPS 后端,让 M1 及以上的 Mac 也能直接生成 3D 网格。作者给出的实测结果是:在 M4 Pro 上,单张图片可在约 3.5 分钟内生成 40 万以上顶点的 mesh,并导出带顶点颜色的 OBJ 和 GLB 文件。
这件事的价值,不在于它把 Mac 变成了新的 AI 算力王者。Mac 依然不是训练大模型的主战场,也很难替代配备高端英伟达显卡的工作站。真正有分量的地方在于,它把“能不能做”变成了“虽然慢一点,但现在真能在本机做”。对 3D 内容生产来说,这个门槛变化很现实。
一个小项目,补上了 Mac 在 3D 生成链条里的缺口
TRELLIS.2 原本是微软推出的图像到 3D 生成方案,但它背后依赖多种 CUDA 专属组件。trellis-mac 做的不是简单包装,而是逐块替换:例如把 flash_attn 换成 PyTorch SDPA,把稀疏 3D 卷积和网格提取改写为纯 PyTorch 或纯 Python 方案,并修补代码里大量写死的 .cuda() 调用。最新一次提交还加入了“从体素属性提取顶点颜色”,这意味着导出的模型不只是结构可看,表面颜色信息也更接近可直接使用的资产。
这类移植最难的地方,从来不是把程序“跑起来”,而是把 CUDA 世界里高度优化、默认依赖 GPU 内核的环节,改造成性能还能接受的替代实现。GitHub 页面里只有 3 次提交、6 个 Star、1 个 Fork,规模很小,但它做的是开发者群体长期遇到的硬问题:很多生成式 3D 项目在论文和演示里很炫,落到设备兼容性上却几乎等于“默认你有英伟达卡”。
为什么它在现在有意义:AI 3D 正从研究演示走向个人生产工具
过去两年,图像生成已经从云端 API 走向本地化部署,3D 生成则慢得多。原因很简单:它更吃显存、更依赖复杂后处理,工具链也更碎。苹果这几年靠 M 系列芯片把统一内存和本地推理能力做起来,很多设计师、iOS 开发者、独立创作者本来就长期在 Mac 上工作,但一到 3D 生成环节,常常还得借云 GPU、远程 Linux 机或者额外买一台 Windows 工作站。
trellis-mac 之所以有现实意义,是因为它削掉了这道额外采购。对一些人来说,这不是性能问题,而是流程问题:能不能在现有机器上试验概念、快速出一个可导入 Blender、Unity 或网页 3D 查看器的模型。项目要求里写得很清楚:推荐 24GB 以上统一内存,4B 模型首次运行还要下载约 15GB 权重,并且需要登录 Hugging Face 获取 gated model 权限。换句话说,它降低的是硬件门槛,不是把整个使用门槛都抹平了。
公开说法是“原生运行 Mac”,行业现实则是:你还得有一台内存够大的 Apple Silicon 设备,还得处理模型授权、环境安装和依赖补丁。它更像开发工具,不是 App Store 式软件。
和现有方案相比,它替代了什么,没替代什么
如果把目前常见的 3D 生成路径放在一起看,trellis-mac 所处的位置其实很明确:它是“本地可用的开源工程解法”,不是“最快”也不是“最省心”。
| 方案 | 典型硬件 | 成本结构 | 速度/易用性 | 适合谁 |
|---|---|---|---|---|
| trellis-mac | Apple Silicon Mac,建议 24GB+ 内存 | 复用现有 Mac,软件开源 | 安装折腾,生成约分钟级 | 独立开发者、设计师、研究者 |
| 原版 TRELLIS.2 / CUDA 路线 | NVIDIA GPU 工作站 | 额外买卡或租机器 | 通常更快,兼容性更成熟 | 追求效率的专业用户 |
| 云端 3D 生成服务 | 无本地高配要求 | 按次或订阅付费 | 最省事,但可控性较低 | 轻量需求、非技术用户 |
如果你是普通用户,最现实的变化并不是“今天就能随手玩 3D AI 了”,而是未来 Mac 上这类工具会越来越多。短期内,真正受益的人群更集中:
- 已有高配 Mac 的设计师,少一次远程算力切换
- 做原型验证的独立团队,可以先本地出样
- 研究者能在非 CUDA 环境复现实验流程
- iOS/macOS 开发者更容易把 3D 生成接进现有工作机
目前的短板也很直接:能生成,不等于已经能上生产线
项目作者已经明确标出几项仍然缺失或被“跳过”的能力,比如 cumesh 相关的孔洞填充、网格简化,以及 nvdiffrast 对应的可微光栅化纹理导出,目前都只是 stub。说得直白一点,这意味着生成结果虽然已经能导出 OBJ、GLB,但在资产清理、纹理质量、后续优化上,离成熟商用流水线还有距离。40 万以上顶点的 mesh 听起来很细,但顶点数高不自动等于更适合游戏、AR 或移动端部署,很多场景反而还要再做减面。
另一个容易被忽略的限制,是 Apple 的 MPS 生态还远没达到 CUDA 的成熟度。PyTorch 在 Mac 上做推理已经可用,但一旦涉及稀疏计算、复杂 3D 算子和大模型组合,性能波动和兼容性问题仍会出现。这也是为什么很多开源项目嘴上支持 Mac,实际 README 往往只给 Linux + CUDA 路线。trellis-mac 的出现说明这个局面正在松动,但还谈不上已经被改写。
