目前自动驾驶汽车的测试方法存在严重缺陷。尽管它们在标准测试中表现优异,但这些测试环境过于单一和可预测。德国图宾根大学的研究人员通过一个名为 Fail2Drive 的项目,让自动驾驶汽车面对大象过马路或假隧道等奇特情景,发现车辆在处理这些“超出训练分布”的意外情况时,性能平均下降了 22.8%。这表明,当前自动驾驶系统因缺乏应对真实世界混乱和随机性的训练,其安全性和可靠性存在根本性的隐忧。
测试的悖论:高分与现实的脱节
自动驾驶汽车在受控测试中表现良好,但在真实的、不可预测的道路上却常常失败。问题出在测试本身,因为目前的评估方法过于 依赖和训练数据相似的环境。
正如首席研究员安德烈亚斯·盖格所解释的,问题不在于车辆驾驶技术差,而在于它们被“训练得太好了”——但仅仅是针对已知的、重复的场景。如果你不训练它们去应对意外,它们就会直接冲向意外。
Fail2Drive:用混乱来检验系统
为了弥补这一差距,图宾根大学的研究团队启动了 Fail2Drive 项目,专门设计了一些古怪甚至荒谬的场景来测试车辆的反应。这些测试旨在模拟真实世界中那些无法预料的混乱,被称为 “超出训练分布” (out-of-distribution) 的场景。
一些典型的测试情景包括:
- 大象过马路: 测试车辆如何应对大型、不常见的动物。
- 滑梯堵路: 一个游乐场滑梯突然挡在路上。
- 卡通式陷阱: 在墙上画出一条假路,试图欺骗车辆的感知系统。
令人担忧的发现
在这些陌生环境下,自动驾驶汽车的表现令人不安。它们常常 犹豫不决或完全误判 前方的障碍物,有时甚至在可以轻松避开的情况下直接撞上去。
研究结果显示,在面对这些不熟悉的情况时,自动驾驶汽车的 性能平均下降了 22.8%,这暴露了其“根本性的稳健问题”。
“大象为什么要过马路?为了揭示你的模型有多脆弱。”
这些发现引发了一个核心问题:如果自动驾驶系统无法被训练来应对现实生活中无穷无尽的随机性,它们是否能真正做到安全上路?目前的技术状况表明,我们离这个目标还有很长的路要走。