MIT将类人推理引入自动驾驶汽车导航

  据外媒报道,为了使自动驾驶汽车进行更多类似人类的推理,麻省理工学院研究人员经创建了一个系统,该系统只使用简单的地图和可视化数据,就能使自动驾驶汽车在新的复杂环境中导航。

  人类驾驶员特别擅长观察并使用简单的工具,在从未驾驶过的道路上进行导航。我们只是简单地将看到的周围环境信息与GPS设备信息进行匹配,来确定我们在哪里,以及需要去哪里。而自动驾驶汽车却很难做到这一点。在新的地区,汽车必须首先规划、分析所有的新道路,这非常耗时。该系统还依赖复杂的地图,这些地图通常是由3D扫描生成,需要大量的计算才能实时生成、处理。

  在近期的国际机器人与自动化会议上,麻省理工学院的研究人员发表了一篇论文,描述了一种自动控制系统,该系统只使用摄像头数据和类似GPS的简单地图,就能“学习”人类司机在小范围内的驾驶模式。然后,它可以模仿人类驾驶员,控制自动驾驶汽车在全新的区域沿着规划路线行驶。该系统与人类驾驶员类似,能检测出地图与道路特征之间的不匹配。这有助于系统确定其位置、传感器或地图是否正确,以便纠正汽车的行驶方向。

  为了训练这套系统,一名人工操作员操控一辆自动丰田普锐斯,该车配备了一些摄像头和一个基本的GPS导航系统,从当地郊区街道收集数据,包括各种道路结构和障碍物。该系统成功地为自动驾驶汽车导航,使汽车沿着预先规划的路径在一个不同的林区行驶,该区域专门用于自动车辆测试。

  第一作者、麻省理工学院研究生Alexander Amini表示,“使用我们的系统,你不需要预先在每条路上进行训练,你只需下载一张新的地图,就让汽车在从未见过的道路上行驶。”

  合著者、计算机科学与人工智能实验室(CSAIL)主任Daniela Rus和电气工程与计算机科学教授Andrew 和Erna Viterbi Professor 补充道,“我们的目标是使自动驾驶汽车能够在新环境下自动导航。比如,如果我们训练一辆自动驾驶汽车,让它在城市环境中行驶,比如在剑桥的街道,那么该系统也能够在树林中平稳行驶,即使是它从未见过的环境。”

  传统的导航系统使用多个模块处理传感器数据,这些模块是为定位、映射、目标检测、运动规划和转向控制等任务定制的。多年来,Rus的团队一直在开发“端到端”的导航系统,该系统不需要任何专门模块,就能处理输入多传感器数据,并输出转向命令。

  然而,到目前为止,这些模型都是严格按照安全路线设计的,没有考虑任何真正的目的地。在这篇新论文中,研究人员改进了他们的端到端系统,使自动驾驶汽车在全新的环境中,从一个目的地行驶到另一目的地。为此,研究人员训练他们的系统,使其在驾驶过程中的任何特定时刻,都能预测所有可能的驾驶指令的全概率分布。

  该系统使用一种称为卷积神经网络(CNN)的机器学习模型,该模型通常用于图像识别。在训练过程中,系统观察并学习人类驾驶员如何驾驶。CNN将方向盘转动与摄像头和输入地图观察到的道路曲率联系起来。最终,它学会了各种驾驶情况下最有可能的转向指令,这些情况包括笔直的道路、十字路口或T形路口、岔路口和弯道。

  Rus说,“在T型交叉口,汽车可以转向很多不同的方向。开始时,这个模型会考虑所有方向,但是有越来越多的数据显示人们是如何做的时候,它会看到一些人左转,一些人右转,但是没有人直行。因此,直行被排除在可能的方向之外。这时模型就知道,在T形交叉口,它只能向左或向右行驶。”

  在测试中,研究人员向系统输入一张地图,地图路线是随机选择的。在驾驶时,该系统从摄像头中提取视觉特征,预测道路结构。例如,它识别一个遥远的停车标志或路边变道标志,来决定在即将到来的十字路口如何行驶。它随时都在利用预测转向命令概率分布,来选择最有可能符合其路线的命令。

  研究人员表示,该系统使用的地图易于存储和处理。自动控制系统通常使用激光雷达扫描来创建大规模、复杂的地图,仅存储旧金山的地图信息就需要大约4000 GB (4TB)的数据。汽车必须为每个新目的地创建新的地图,这意味着要处理大量的数据。而他们的系统使用的地图只需要40G的数据就能捕捉所有信息。

  在自动驾驶过程中,系统还会不断将其视觉数据与地图数据进行匹配,并记录任何不匹配的地方。这有助于自动驾驶汽车更好地确定自己的位置。如果输入信息互相矛盾,它能确保汽车在最安全的道路上行驶。比如,如果汽车在一条没有转弯的直路上行驶,而GPS显示必须右转,那么汽车能知道是继续直行还是停下来。