Waymo 这次没有发布新车,也没有宣布机器人出租车开进新城市。它发布的是一个“虚拟司机”:ReD,Reference Driver。

这东西听起来不如新车性感,但可能更关键。Waymo 和代尔夫特理工在 Nature Communications 发表研究,用 ReD 模拟一个合格人类司机在突发风险前如何判断、犹豫、刹车、重估计划。Waymo 把它叫作“行为版碰撞测试假人”。

传统碰撞测试假人测的是撞上之后人会不会受伤。ReD 想测的是,撞上之前,避险反应到底算不算合格。

ReD 是一个评估标尺,不是车端司机

ReD 不是自动驾驶车上的实时控制系统。也不是训练真人司机的工具。

它是一个计算机认知模型,用来给自动驾驶系统做避撞评估。更准确地说,它提供一个“谨慎且胜任的人类司机”参照物。

读者最关心的问题目前能确定的答案边界
发生了什么Waymo 联合代尔夫特理工发布 ReD,并开源不是新车、不是 Robotaxi 功能上线
ReD 做什么模拟人类司机遇到突发风险时的避撞决策不等于证明自动驾驶全面强于人类
理论基础采用 active inference 主动推断框架这是一个被采用的神经科学框架,不是万能脑科学定论
行业状态Waymo 称希望推动共享科学标准,并与研究者、监管方、SAE 等合作目前不是正式行业标准,也不能说监管已经采纳

ReD 模拟的人类特征很具体。

司机会看物体在视野里变大的速度,也就是 looming,判断前方威胁。司机也会默认别人遵守交通规则,直到看到对方明显违规。

当“惊讶”超过阈值,司机会重新评估原来的驾驶计划。从油门切到刹车,还会有约 0.2 秒的脚部切换延迟。

这些细节说明一件事:人类司机不是最优算法。我们靠预期、经验和有限感知开车。ReD 要模拟的,正是这种“不完美但合格”的反应。

这比一句“人类司机基准”更有价值。因为安全评估最怕空话。空话说“谨慎”,模型至少要回答:什么时候算危险?什么时候该重估?延迟多少算合理?

Waymo 抢的是安全驾驶的解释权

Waymo 的公开说法,是推动行业形成一个共享的、科学化的标准,定义什么叫“谨慎且胜任的人类反应”。

这句话要分两层读。

明面上,它是在开源一个研究工具。深一层,它是在争夺自动驾驶安全评估的语言。

过去自动驾驶公司爱比路测里程、接管次数、事故率。但这些数字很难横向比较。

旧金山、凤凰城和洛杉矶不是同一张考卷。天气、道路、交通参与者、施工密度、场景难度都不同。你说你安全,我说我更安全,监管最后看到的是一堆口径不一的材料。

ReD 换了一个角度:不要只问车跑了多少英里,也问它在同一个突发场景里,反应是否接近一个谨慎且胜任的人类司机。

评估路线优点问题
路测里程直观,容易传播场景难度不同,数字容易失真
接管次数能反映系统压力接管标准、司机习惯、城市环境不同
事故率结果明确低频事件,样本和场景解释很难统一
ReD 这类参考模型能把避险反应拆成可讨论变量仍需外部验证,不能由 Waymo 单方面定案

Waymo 的算盘不难看。

自动驾驶进入监管密集区后,单纯炫技术不够了。你要让城市管理者、保险机构、标准组织相信:你的“安全”不是营销词,而是一套能被复查、能被质疑、能被追责的评估语言。

天下熙熙,皆为利来。标准从来不只是学术问题。它也是入口、门槛和话语权。

但这里不能拔高过头。ReD 是 Waymo 提出的基准,天然带着 Waymo 的问题意识和工程偏好。开源增加透明度,论文发表增加科学背书,可它还需要外部研究者、竞争对手和监管机构反复拆。

好标准不是自己宣布出来的。它要经得住别人拿来用、拿来挑错、拿来反驳。

谁会受影响,接下来该看什么

最直接受影响的,不是普通乘客先去下载 ReD。普通乘客更现实的动作,是看机器人出租车公司的安全报告时,少看一句“我们比人类安全”,多看它有没有可复核的场景基准。

如果一家公司只给总里程和漂亮事故率,却不解释突发避险如何评估,那就要打折看。

对城市监管者和采购方,ReD 的意义更直接。以后审批 Robotaxi 扩区,不该只问“你跑了多少英里”,还可以要求企业提交同类场景下的避撞评估、参考人类基准和失败案例解释。

对自动驾驶安全团队,这类模型会推高评估门槛。团队可能要把测试用例从“覆盖更多道路”补到“覆盖更多突发认知场景”:视觉威胁、规则预期被打破、计划重估、刹车延迟。评测会更细,也更难糊弄。

我更在意三个观察点。

观察点为什么重要目前状态
SAE、监管方是否真正引用 ReD 或类似框架决定它能否进入标准语言Waymo 称正在合作推动,还不是正式采纳
外部研究者能否复现和挑战模型决定开源是否变成真实透明需要更多第三方验证
竞争对手是否接受同一标尺决定行业能否横向比较目前还看不清

这有点像早期汽车工业从马力竞赛走向碰撞测试、安全带、气囊标准。不完全一样,但逻辑相通:机器性能跑到一定阶段,胜负会转到制度接口。

谁能把风险讲清楚,谁就更容易被允许上路。谁只能说“相信我”,谁就会被监管反复追问。

Waymo 这次做对的一点,是没有只喊“我很安全”。它拿出了一个可讨论、可测试、可批评的标尺。

问题也在这里。标尺一旦由公司提出,就必须接受更严苛的公共审查。否则它会从科学工具滑向商业话术。

ReD 的真正价值,不在于替 Waymo 盖章。它更像一块试金石:自动驾驶行业到底愿不愿意把安全从宣传页里拿出来,放到一套共同可验证的语言里。