Joris Rijsdijk、Christoph Peters、Michael Weinmann 和 Ricardo Marroquim 的论文《Gaussian Point Splatting》已列入 ACM Transactions on Graphics 45(4),将在 SIGGRAPH 2026 展示,时间是 7 月 20 日。
这篇论文有意思的地方,不是又给 3D Gaussian Splatting 起了一个新名字。它改的是渲染负载的形态:不再主要按传统方式绘制每个 Gaussian splat,而是从 Gaussians 里采样像素大小的不透明点,再把点独立 splat 到 framebuffer。
我的判断是,它提供了一条更偏工程吞吐的路线。适合追求超大规模场景实时交互的人看,但不适合被理解成无损替换。
方法核心:把连续 splat 拆成随机点
Gaussian Point Splatting 的基本做法,是从每个 Gaussian 体内采样像素级、完全不透明的点。每个点独立写入 framebuffer。
这一步看起来像“撒点”,但难点不小。同一个像素可能被多个点命中。点少了,opacity 对不上;点多了,画面会变厚,噪声和走样也会冒出来。
论文的关键贡献之一,就是推导每个 Gaussian 应该采样多少点,以及这些点该怎样分布,才能匹配目标 opacity。
这个变化对图形开发者很直接:它把一部分连续合成问题,转成了可并行投点问题。GPU 更喜欢后者。
| 路线 | 基本做法 | 工程收益 | 画面代价 |
|---|---|---|---|
| 原始 Gaussian splatting | 直接绘制 Gaussian splat | 表达和保真路径更直观,已被大量 3DGS 工作采用 | 大场景下排序、合成和负载压力更突出 |
| Gaussian Point Splatting | 从 Gaussian 采样不透明点,独立写入 framebuffer | 更适合大规模并行,负载更均衡 | 有轻微噪声,aliasing 表现与原方法不同 |
所以它不是“更漂亮”的论文,而是“更好喂 GPU”的论文。这里的取舍很朴素:舍一点洁净,换更大的吞吐空间。
性能来源:atomics、剔除和负载均衡
作者提到的方法包括 64-bit atomics、并行编程 primitives、层级视锥剔除和遮挡剔除。
64-bit 原子操作的作用,是让多个线程可以并发写 framebuffer。层级视锥剔除和遮挡剔除,则尽量不把看不见的 Gaussians 送进后续流程。
这几件事合在一起,指向同一个目标:减少串行瓶颈,让 GPU 上的线程更均匀地干活。
原文称该方法可实时渲染 hundreds of millions of Gaussians。这里不能改写成具体数量、具体帧率或某张显卡上的成绩。公开页面目前没有给出完整帧率和硬件配置。
论文、源码、补充视频和在线 viewer 可以作为验证入口。但它们不等于第三方评测,也不能直接推出“所有 3DGS 管线都能低成本替换”。
限制也很清楚。训练方式、数据分布、显示分辨率、temporal reprojection、后处理,以及硬件上的原子操作性能,都会改变最终体验。补充视频中区分是否使用 temporal reprojection,本身就说明噪声控制不是免费来的。
谁最该看:大场景 3DGS 的开发者和研究者
最该看这篇论文的,是两类人。
一类是图形学与实时渲染开发者。尤其是做大规模 3DGS viewer、数字孪生、机器人仿真、虚拟制片预览的人。对他们来说,关键问题不是单帧能不能更干净,而是视角转动时能不能稳定、加载能不能少等、显存和带宽能不能扛住。
这类团队更现实的动作,不是马上迁移,而是先做小规模接入验证。重点看三件事:现有工具链改动成本、目标硬件上的 64-bit atomics 表现、快速运动时噪声是否可接受。
另一类是关注 3D Gaussian Splatting 大场景应用的研究者。Gaussian Point Splatting 至少给了一个清楚信号:大场景 3DGS 的瓶颈,已经不只在表示和训练,也在实时显示、可见性处理和 GPU 调度。
接下来最该看四个变量:
| 变量 | 为什么重要 | 目前该怎么判断 |
|---|---|---|
| 测试硬件与帧率 | 决定“实时”到底落在哪类设备上 | 等论文正式细节和可复现实测 |
| 接入成本 | 决定现有 3DGS 工具链能不能用 | 先看源码结构和数据格式改动 |
| 噪声与 aliasing | 决定产品画面是否能接受 | 重点测快速运动、细线结构、半透明边界和高频纹理 |
| temporal reprojection | 决定稳定性是否依赖额外技巧 | 分开看开关前后的画质和延迟 |
如果这些变量过关,Gaussian Point Splatting 的价值会落在工程侧:让超大规模 3DGS 从“能展示”更接近“能交互”。
如果过不了,它也不是没有价值。它至少把问题摆到台面上:大场景渲染的胜负,很多时候不在表示多优雅,而在谁更会把任务切碎、分发,并让 GPU 持续满载。
