为什么研究人员让自动驾驶汽车撞大象

目前自动驾驶汽车的测试方法存在严重缺陷。尽管它们在标准测试中表现优异，但这些测试环境过于单一和可预测。德国图宾根大学的研究人员通过一个名为 Fail2Drive 的项目，让自动驾驶汽车面对大象过马路或假隧道等奇特情景，发现车辆在处理这些“超出训练分布”的意外情况时，性能平均下降了 22.8%。这表明，当前自动驾驶系统因缺乏应对真实世界混乱和随机性的训练，其安全性和可靠性存在根本性的隐忧。

测试的悖论：高分与现实的脱节

自动驾驶汽车在受控测试中表现良好，但在真实的、不可预测的道路上却常常失败。问题出在测试本身，因为目前的评估方法过于 依赖和训练数据相似的环境。

正如首席研究员安德烈亚斯·盖格所解释的，问题不在于车辆驾驶技术差，而在于它们被“训练得太好了”——但仅仅是针对已知的、重复的场景。如果你不训练它们去应对意外，它们就会直接冲向意外。

Fail2Drive：用混乱来检验系统

为了弥补这一差距，图宾根大学的研究团队启动了 Fail2Drive 项目，专门设计了一些古怪甚至荒谬的场景来测试车辆的反应。这些测试旨在模拟真实世界中那些无法预料的混乱，被称为 “超出训练分布” (out-of-distribution) 的场景。

一些典型的测试情景包括：

大象过马路： 测试车辆如何应对大型、不常见的动物。
滑梯堵路： 一个游乐场滑梯突然挡在路上。
卡通式陷阱： 在墙上画出一条假路，试图欺骗车辆的感知系统。

令人担忧的发现

在这些陌生环境下，自动驾驶汽车的表现令人不安。它们常常 犹豫不决或完全误判 前方的障碍物，有时甚至在可以轻松避开的情况下直接撞上去。

研究结果显示，在面对这些不熟悉的情况时，自动驾驶汽车的 性能平均下降了 22.8%，这暴露了其“根本性的稳健问题”。

“大象为什么要过马路？为了揭示你的模型有多脆弱。”

这些发现引发了一个核心问题：如果自动驾驶系统无法被训练来应对现实生活中无穷无尽的随机性，它们是否能真正做到安全上路？目前的技术状况表明，我们离这个目标还有很长的路要走。