The Innovation|新一代智能避障:仿生视觉模拟助力安全驾驶

蝗虫在自然界中长期演化出的LGMD(小叶巨型运动检测器,lobula giant movement detector)神经元和视觉通路,帮助其在高速移动时有效避免与接近目标的碰撞。自动驾驶领域的研究者通过对蝗虫视觉的仿生模拟,取得了较好的避障效果。为进一步优化LGMD模型的自动避障能力,本工作引入了人类在驾驶过程中表现出的两种人为因素(中心注意偏置和双目视觉)。中心注意偏置帮助LGMD模拟了驾驶过程中驾驶者的注意力机制;双目视觉则用两个LGMD模型模拟了人类的双眼结构,以解决避障过程中对立体世界的距离感知问题。通过中心注意偏置和双目视觉的引入,LGMD更加贴合人类在驾驶过程中的避障行为
动机
目前地面机器人和空中无人机避障的“深度学习+大规模数据+强监督标记”技术框架趋于饱和。它们的发展逐渐面临来自真实开放场景的挑战,包括小数据、弱监督和跨场景。受人类认知的神经结构和过程(例如人类视觉、听觉和触觉系统)以及从日常驾驶任务中学习的知识(例如高级认知系统)的启发,本文报道了一个用于集成碰撞感知和避障的高级认知系统。这种生物启发的认知方法在实际驾驶场景中具有良好的鲁棒性、高自适应性和低功耗的优点。如图1为基于驾驶人因启发性的LGMD自动避障示意图。
图片
图1 基于驾驶人因启发性的LGMD自动避障示意图
用于碰撞检测的LGMD
作为运动感知的主要感觉,视觉为导航、航向控制、视线稳定和其他与运动相关的活动提供了关键信息。生物视觉神经网络已在自然界中进化了数百万年,是设计人工视觉系统用于防碰撞的理想模型。作为一种视觉神经结构,蝗虫的LGMD神经元显示出很强的检测运动物体的能力。LGMD神经元(图2)由四层神经网络组成,第一层检测亮度变化,第二层和第三层处理激发和抑制反应之间的相互耦合,最后一层通过阈值比较输出峰值响应。当蝗虫的眼睛察觉到一个接近的物体时,LGMD神经元会受到刺激,将输出一个尖峰信号,警告蝗虫在远处有潜在的危险。LGMD神经元在感知运动物体时的高灵敏度适合于帮助车辆感知正在接近的物体。
图片
图2 LGMD 模型
为了利用生物启发视觉在碰撞检测中的优势,本文报道了一种仿生视觉机制,该网络具有与LGMD神经元相似的碰撞选择性。视觉刺激从光感受器(P)层被感知并传递到激发(E)和抑制(I)层,然后视觉信号被分解成ON/OFF通道,这将指示其导航中的亮度增加/降低。ON/OFF通道中的视觉信号在抵达求和(S)层中后分别融合,最后在分组(G)层中全部信号进一步聚合以用于输出。当潜在危险来临时,视觉刺激会激活LGMD神经元以检测潜在的碰撞,蝗虫随后将更新其行为以避免碰撞。
驾驶中的人为因素
到目前为止,只有少数研究考虑了驾驶过程中的人为因素。与前序研究工作不同的是,本研究工作同时讨论了两个重要人为因素对驾驶过程的影响,即中心注意偏置双目视觉
中心注意偏置:中心注意偏置是驾驶任务的关键因素,人类视觉会主动搜索即将接近场景中的要点并绑定视觉特征以获得更高的认知理解,即来自中心视野/区域的视觉信息被更多关注,而来自外周视野的视觉信息被较少关注。一旦潜在危险接近,驾驶员的注视或注意力分布在中心视觉区域表现出高度选择性,以提高他们的警觉性。为了反映障碍物检测过程中注视分布的选择性,本研究报道的LGMD考虑了中心注意偏置在接收视觉刺激和将处理后的信号传输到P层中的影响。具体而言,我们提出以高斯模型建模中心注意偏置。图3所示的高斯滤波器被并入LGMD,以凸显视觉刺激的中心区域,同时模糊外周视野的刺激信息,提高了LGMD对运动的敏感性。
图片
图3 以高斯模型建模中心注意偏置
双目视觉:在驾驶任务中,与单眼视觉相比,双目视觉可以在导航中融合深度测量,有助于准确感知障碍物距离。大多数现有的LGMD模型具备了单目视觉下的碰撞检测性能,而我们提出的LGMD在双目视觉下有更好的防碰撞性能。
智能避障策略
基于以上对LGMD和驾驶中人为因素的讨论,形成了本研究工作的一种智能避障策略(图4)。该策略受蝗虫基于视觉的障碍回避机制的启发,还考虑了中心注意偏置和双目视觉。中心注意偏置被建模并放置在LGMD的P层前面,另外,左LGMD和右LGMD分别处理车辆前方的左摄像机和右摄像机的图像。在物体运动期间,一旦左侧或右侧LGMD检测到碰撞,就会同时触发两个方向选择和碰撞体距离预测程序。本研究比较了左右LGMD模型输出的NMPs(归一化膜电位)值,将NMP值较大的一侧做为所选择的方向;左右LGMD模型的NMP和FFI(前馈抑制)以及当前机器人运动速度被输入到训练的多层感知器(MLP)模型中即可输出预测距离。在方向选择和距离预测的基础上最终导出了最佳电机控制,以优化紧急情况下的避障转向选择。
图片
图4 智能避障策略
总结与展望
本文研究了仿生视觉模拟在自动驾驶智能避障的应用,分析了如何基于蝗虫的LGMD神经元和视觉通路构建智能避障系统。为了解决传统LGMD模型的局限性,本研究引入了驾驶过程中的两种人为因素(中心注意偏置和双目视觉),对该模型展开了系统优化。LGMD模型在应用过程中对计算资源依赖小,在自动驾驶智能避障多种技术方案之中具有独特的优势。在真实道路上,不同的天气和照明条件会对驾驶员的视觉和反应能力产生很大影响,这是一个不可忽视的研究挑战。未来,对仿生视觉模型的进一步研究和开发应侧重于处理具有复杂环境的道路场景。
责任编辑
程   鑫    南京大学
李尚燚    北京化工大学