AI 初创公司 Decart 6 月 10 日发布 Oasis 3。它是一款实时世界模型,可以生成可交互的写实驾驶环境,并从发布当天起通过 API 向开发者开放。
价格也直接摆出来了:每秒 0.02 美元,企业客户按用例定价。首批目标客户,是需要大量构造边缘场景的自动驾驶公司。
这件事有意思的地方不在于“AI 又会生成街景了”。而在于世界模型开始从演示视频,走到可接入的开发工具。
但问题也卡在这里:驾驶测试要的不是画面像,而是场景可复现、物体可追踪、碰撞可信。Oasis 3 现在离这个标准还有距离。
Oasis 3 的变化:从演示,走到 API
Decart 给 Oasis 3 选的切口很务实:自动驾驶。
自动驾驶团队长期缺一种东西:罕见但关键的测试场景。比如复杂路口、突然变道、恶劣天气、遮挡行人。真实道路采集慢,传统仿真建模贵,封闭场地也不可能覆盖所有组合。
生成式世界模型如果足够便宜、足够快,就可能变成补充工具。
Oasis 3 目前支持前向和两侧多摄像头环境生成。开发者可以在写实街景里实时操控车辆。Decart 称,它的优势来自三点:写实生成、可无限生成,以及 DOS,也就是 Decart Optimization Stack 带来的低运行成本。
公司 CEO Dean Leitersdorf 还称,模型运行成本可比同行低一个数量级以上。这个说法可以先记下,但不能直接当行业结论。目前还没有看到第三方基准验证。
| 维度 | Oasis 3 当前信息 | 对开发者的意义 | 现实判断 |
|---|---|---|---|
| 开放方式 | API 优先开放 | 能接入测试流程或原型产品 | 比研究演示更接近平台 |
| 价格 | 每秒 0.02 美元,企业按用例定价 | 小团队可以先试算成本 | 大规模并发成本仍要实测 |
| 目标客户 | 自动驾驶公司,未来扩展到机器人和其他 physical AI 场景 | 先服务最缺仿真数据的行业 | 切口合理,但验证门槛很高 |
| 技术卖点 | 写实、实时、可长时间生成 | 便于快速构造边缘案例 | 价值取决于物理一致性 |
这也是 Decart 近期融资故事的一部分。公司成立约两年,近期完成 3 亿美元融资,估值接近 40 亿美元。投资方包括 Toyota、Adobe、eBay 和 Nvidia。
这些投资方的含义不完全一样。Toyota 更贴近出行和自动驾驶场景。Adobe、eBay 更接近内容、电商和实时视频生成。Oasis 3 把 Decart 的叙事往前推了一步:它不只想做视频生成,还想做世界模型基础设施。
对开发者和投资人,真正影响不一样
对自动驾驶开发者,Oasis 3 最现实的用法不是替代现有仿真平台。
更像是放在流程前端:快速生成视觉场景,探索边缘案例,筛掉明显没价值的组合。之后再交给传统仿真、封闭场地和真实道路测试复核。
这会影响团队怎么分工。算法和仿真团队可以先拿 API 做低成本原型,但采购或安全验证团队不应该急着把它列为合规验证工具。现在更合理的动作,是小规模接入、记录复现率、对比已有仿真结果,而不是迁移主测试流水线。
对机器人开发者,意义也类似。Oasis 3 说明世界模型正在往 physical AI 场景靠近。未来如果能扩展到室内、仓储、工厂、家庭环境,它会有用。但当前公开主线还是驾驶,不能把它直接等同于通用机器人仿真平台。
对技术和投资读者,我更在意两个问题。
一个是 API 化是否真的带来开发者生态。Decart 称已有超过 10 万名开发者社区成员,许多人此前围绕其实时视频模型 Lucy 做电商和直播产品。Oasis 3 试图把其中一部分人带到物理世界仿真。
另一个是成本优势能不能被工程场景证明。每秒 0.02 美元看上去不高,但自动驾驶测试常常涉及长时、多摄像头、大规模并发。账不能只按单秒算,要按完整测试任务算。
最大短板:世界会漂,车还会穿过去
Oasis 3 现在最关键的问题,是物理一致性不够硬。
TechCrunch 试用中,Oasis 3 能根据提示生成漂亮的纽约晨间街景。但开车一段时间后,场景逐渐变成普通西方城市。尝试原路返回时,原来的路口已经消失。
这不是小瑕疵。
对普通视频生成来说,城市风格有点漂,可能还能接受。对自动驾驶测试来说,同一路口返回后不存在,意味着场景状态不可复现。测试结论也会被污染。
更严重的是,车辆可能直接穿过其他车辆。这说明模型还没有稳定的物体意识,也没有严格的碰撞物理。
Leitersdorf 承认,这是重大研究问题。他把部分原因归于训练数据里“正常驾驶”远多于事故数据。Oasis 3 采用自回归方式逐帧生成,每帧约 8000 个 token。以每秒数十帧运行时,相当于每秒处理数十万 token,上下文窗口很快会被填满。
这解释了为什么长时间生成会漂。模型需要记住前面发生过什么,也要保持道路结构、车辆位置和城市布局不乱。一旦记忆压缩不够好,所谓“无限生成”就会变成风险来源。
Decart 正在研究更长上下文和更高效的记忆压缩。下一版还计划支持用环境视频启动生成,而不只是图片或提示。
接下来最该看三件事,不是宣传片有多漂亮。
| 观察点 | 为什么重要 | 如果没有进展意味着什么 |
|---|---|---|
| 是否公布可复现的物理一致性指标 | 自动驾驶测试需要可度量 | 只能停留在演示和原型阶段 |
| 是否有客户接入真实测试流水线 | 能证明工程价值 | 平台叙事会走在落地前面 |
| 每秒 0.02 美元在长时、多摄像头、并发任务下是否仍划算 | 成本优势要按任务计算 | 低价 API 未必等于低总成本 |
所以,对自动驾驶公司来说,今天的 Oasis 3 更适合被放进“探索工具箱”,不是“验证工具箱”。
采购可以观望,研发可以小试,安全验证要慢一点。画面越像真实世界,越不能忘了问一句:它到底能不能按真实世界的规则运行。
