人类可能是全自动驾驶汽车无法进入城市街道的最大障碍之一。如果机器人要想在波士顿市中心安全驾驶,必须能预测周围司机、骑车人以及行人接下来会做什么。行为预测是一个棘手的问题,目前的人工智能解决方案要么过于简单(它们可能假设行人总是走直线),要么过于保守(为了避让行人,机器总是将车停下来),或者只能预测一个智能体的下一步动作(道路上通常同时会有很多用户)。
MIT 的研究人员为这一复杂的挑战
设计了一种看似简单的解决方案。他们将多智能体行为预测问题分解成更小的部分,单独处理每个部分,因此计算机可实时解决这一复杂任务。他们的行为预测框架首先会猜测两个道路使用者之间的关系——哪辆车、哪个骑自行车的人或者行人拥有通行权,以及哪个智能体会让路——并使用这些关系来预测多个智能体的未来轨迹。面对自动驾驶公司 Waymo 汇编的真实交通流量的庞大数据,这些估计的轨迹比其他机器学习模型预测的轨迹更准确。MIT 的技术甚至超过了 Waymo 最近发布的模型。由于研究人员将问题分解为多个更简单的部分,他们的技术占用的内存更少。研究人员的机器学习模型被称为
M2I,它需要两个输入:汽车、骑自行车的人和行人过去在交通环境(例如十字路口)中交互的轨迹,以及包含街道位置、车道配置等信息的地图。
关系预测器使用这些信息推断出两个智能体中哪一个具有优先通行权,将一个归类为通行者,另一个归类为让行者。然后一个名为边际预测器的预测模型猜测通行者的轨迹,因为该智能体独立行动。第二个名为条件预测器的预测模型随后根据通行智能体的动作猜测让行智能体将要做什么。该系统针对让行者和同行者预测许多不同的轨迹,分别计算每种轨迹的概率,然后选择发生可能性最高的六个组成结果。M2I 输出关于这些智能体在接下来的8秒钟内将如何行动的预测。在一个示例中,他们的方法让车辆减速,以便让一名行人通过马路,然后在通过交叉路口时加速。在另一个示例中,车辆等到几辆车通过之后才从一条小街转上了繁忙的主干道。虽然这些初步研究侧重于两个智能体之间的交互,但是 M2I 可以推断出许多智能体之间的关系,然后通过联系多个边际和条件预测变量猜测轨迹。