Waymo 这次没有发布新车,也没有宣布机器人出租车开进新城市。它发布的是一个“虚拟司机”:ReD,Reference Driver。
这东西听起来不如新车性感,但可能更关键。Waymo 和代尔夫特理工在 Nature Communications 发表研究,用 ReD 模拟一个合格人类司机在突发风险前如何判断、犹豫、刹车、重估计划。Waymo 把它叫作“行为版碰撞测试假人”。
传统碰撞测试假人测的是撞上之后人会不会受伤。ReD 想测的是,撞上之前,避险反应到底算不算合格。
ReD 是一个评估标尺,不是车端司机
ReD 不是自动驾驶车上的实时控制系统。也不是训练真人司机的工具。
它是一个计算机认知模型,用来给自动驾驶系统做避撞评估。更准确地说,它提供一个“谨慎且胜任的人类司机”参照物。
| 读者最关心的问题 | 目前能确定的答案 | 边界 |
|---|---|---|
| 发生了什么 | Waymo 联合代尔夫特理工发布 ReD,并开源 | 不是新车、不是 Robotaxi 功能上线 |
| ReD 做什么 | 模拟人类司机遇到突发风险时的避撞决策 | 不等于证明自动驾驶全面强于人类 |
| 理论基础 | 采用 active inference 主动推断框架 | 这是一个被采用的神经科学框架,不是万能脑科学定论 |
| 行业状态 | Waymo 称希望推动共享科学标准,并与研究者、监管方、SAE 等合作 | 目前不是正式行业标准,也不能说监管已经采纳 |
ReD 模拟的人类特征很具体。
司机会看物体在视野里变大的速度,也就是 looming,判断前方威胁。司机也会默认别人遵守交通规则,直到看到对方明显违规。
当“惊讶”超过阈值,司机会重新评估原来的驾驶计划。从油门切到刹车,还会有约 0.2 秒的脚部切换延迟。
这些细节说明一件事:人类司机不是最优算法。我们靠预期、经验和有限感知开车。ReD 要模拟的,正是这种“不完美但合格”的反应。
这比一句“人类司机基准”更有价值。因为安全评估最怕空话。空话说“谨慎”,模型至少要回答:什么时候算危险?什么时候该重估?延迟多少算合理?
Waymo 抢的是安全驾驶的解释权
Waymo 的公开说法,是推动行业形成一个共享的、科学化的标准,定义什么叫“谨慎且胜任的人类反应”。
这句话要分两层读。
明面上,它是在开源一个研究工具。深一层,它是在争夺自动驾驶安全评估的语言。
过去自动驾驶公司爱比路测里程、接管次数、事故率。但这些数字很难横向比较。
旧金山、凤凰城和洛杉矶不是同一张考卷。天气、道路、交通参与者、施工密度、场景难度都不同。你说你安全,我说我更安全,监管最后看到的是一堆口径不一的材料。
ReD 换了一个角度:不要只问车跑了多少英里,也问它在同一个突发场景里,反应是否接近一个谨慎且胜任的人类司机。
| 评估路线 | 优点 | 问题 |
|---|---|---|
| 路测里程 | 直观,容易传播 | 场景难度不同,数字容易失真 |
| 接管次数 | 能反映系统压力 | 接管标准、司机习惯、城市环境不同 |
| 事故率 | 结果明确 | 低频事件,样本和场景解释很难统一 |
| ReD 这类参考模型 | 能把避险反应拆成可讨论变量 | 仍需外部验证,不能由 Waymo 单方面定案 |
Waymo 的算盘不难看。
自动驾驶进入监管密集区后,单纯炫技术不够了。你要让城市管理者、保险机构、标准组织相信:你的“安全”不是营销词,而是一套能被复查、能被质疑、能被追责的评估语言。
天下熙熙,皆为利来。标准从来不只是学术问题。它也是入口、门槛和话语权。
但这里不能拔高过头。ReD 是 Waymo 提出的基准,天然带着 Waymo 的问题意识和工程偏好。开源增加透明度,论文发表增加科学背书,可它还需要外部研究者、竞争对手和监管机构反复拆。
好标准不是自己宣布出来的。它要经得住别人拿来用、拿来挑错、拿来反驳。
谁会受影响,接下来该看什么
最直接受影响的,不是普通乘客先去下载 ReD。普通乘客更现实的动作,是看机器人出租车公司的安全报告时,少看一句“我们比人类安全”,多看它有没有可复核的场景基准。
如果一家公司只给总里程和漂亮事故率,却不解释突发避险如何评估,那就要打折看。
对城市监管者和采购方,ReD 的意义更直接。以后审批 Robotaxi 扩区,不该只问“你跑了多少英里”,还可以要求企业提交同类场景下的避撞评估、参考人类基准和失败案例解释。
对自动驾驶安全团队,这类模型会推高评估门槛。团队可能要把测试用例从“覆盖更多道路”补到“覆盖更多突发认知场景”:视觉威胁、规则预期被打破、计划重估、刹车延迟。评测会更细,也更难糊弄。
我更在意三个观察点。
| 观察点 | 为什么重要 | 目前状态 |
|---|---|---|
| SAE、监管方是否真正引用 ReD 或类似框架 | 决定它能否进入标准语言 | Waymo 称正在合作推动,还不是正式采纳 |
| 外部研究者能否复现和挑战模型 | 决定开源是否变成真实透明 | 需要更多第三方验证 |
| 竞争对手是否接受同一标尺 | 决定行业能否横向比较 | 目前还看不清 |
这有点像早期汽车工业从马力竞赛走向碰撞测试、安全带、气囊标准。不完全一样,但逻辑相通:机器性能跑到一定阶段,胜负会转到制度接口。
谁能把风险讲清楚,谁就更容易被允许上路。谁只能说“相信我”,谁就会被监管反复追问。
Waymo 这次做对的一点,是没有只喊“我很安全”。它拿出了一个可讨论、可测试、可批评的标尺。
问题也在这里。标尺一旦由公司提出,就必须接受更严苛的公共审查。否则它会从科学工具滑向商业话术。
ReD 的真正价值,不在于替 Waymo 盖章。它更像一块试金石:自动驾驶行业到底愿不愿意把安全从宣传页里拿出来,放到一套共同可验证的语言里。
