麻省理工学院正在教汽车像人类一样使用简单的地图和视觉数据进行导航
麻省理工学院正在通过模仿人类驾驶员的导航方式,为自动驾驶汽车在陌生区域中出行提供新的途径。它被称为变分式端到端导航和本地化,它使用基本地图和摄像机来分析和导航一个尚未使用详细数据库进行编程的新位置。
自动驾驶汽车的开发证明了开发自动驾驶功能的任务是多么困难,并且揭示了人与机器智能之间巨大的鸿沟-不仅在计算能力方面,而且在每个人如何解决问题方面。
例如,人类发现在陌生的,复杂的位置导航非常容易,只需要一张粗略的地图和眼睛就可以观察,而即使在熟悉的地区,自动驾驶汽车也倾向于依靠非常复杂的传感器阵列来生成详细的地图,用于本地化,映射,对象检测,运动计划和转向控制的数据库。对于一个旧金山大小的城市,此类地图的大小可能高达4 TB。
人类可以使用非常基础的信息,然后将其应用于非常复杂的情况。一个人需要的只是一张简单的地图,例如GPS设备上的地图,并且可以将其与他们在周围看到的东西联系起来。视情况而定,看似无关的数据也可以被忽略或合并到导航中,例如可以通过注意沿途的酒吧从特拉法加广场步行到伦敦利物浦街车站的人。
麻省理工学院的团队认为,可变的端到端导航和定位旨在模仿人类的方法,方法是向驾驶员学习,然后仅使用简单的地图和摄像机就可以使用该信息来适应新情况。想法是,机器将能够获取地图的近似值,然后对其进行校正,填写详细信息并确定其位置,以便可以将其路线校正至所需的目的地。
为了教授计算机,团队让一名人类驾驶员操作了一辆自动的丰田普锐斯(Prius),同时几个摄像头和一个基本的GPS收集了有关郊区街道,道路结构和障碍物的数据。与依赖于非常复杂的机器推理和数据库的更传统的方法不同,MIT方法是从视觉提示中学习的。这意味着当它进入一个新区域时,它不需要详细的说明,只需要一张基本地图即可。
麻省理工学院的团队由计算机科学与人工智能实验室(CSAIL)主任丹妮拉·鲁斯(Daniela Rus)领导,开发了一种端到端导航系统,该系统的不同之处在于,它像人类一样,专门用于寻找目的地而不是目的地专注于走这条路。它通过从驾驶员那里学到的知识来进行此操作,然后应用统计方法来预测完整的概率分布,同时考虑到特定时间点的所有可能的转向命令。
麻省理工学院说,这种预测是基于一种称为卷积神经网络(CNN)的机器学习模型,该模型通过处理在驾驶员训练过程中收集的图像来学习如何进行转向。这样,它知道如何处理各种类型的道路和路口,包括T形交叉路口。
罗斯说:“起初,在一个T形交叉路口,汽车可以转向许多不同的方向。” “该模型首先考虑所有这些方向,但是当它看到人们做事的越来越多的数据时,它将看到有些人向左转,有些人向右转,但是没有人直走。直行被排除在外方向,模型得知,在T形路口,它只能向左或向右移动。”
可变的端到端导航和定位功能还使汽车可以考虑其他视觉提示,例如标志,道路线和其他标记,以弄清它所处的道路类型并预测交叉路口以及如何转向在特定情况下。此外,它可以分析街道模式以帮助确定其位置。一条高概率线与其所看到的相匹配,并且该地图指示其位置的正确定位。这样,一个中型城市的4 TB的地图可以缩减为整个星球的40 GB的数据库。
当数据不匹配时,它也是一个更宽容的系统,能够处理传感器故障和嘈杂的输入。
Rus说:“我们的目标是实现对新环境中的驾驶具有鲁棒性的自主导航。” “例如,如果我们训练自动驾驶汽车在诸如剑桥街道之类的城市环境中行驶,即使在以前从未见过的环境中,该系统也应该能够在树林中平稳行驶。”