如何实现预测模型在不同驾驶场景中的可迁移性?

如何实现预测模型在不同驾驶场景中的可迁移性?

如何使得预测模型能够自适应地捕捉驾驶行为的差异?

在对真实数据的预测任务中,可迁移性和自适应性预测性能有帮助吗?

2. 如何实现预测模型在不同驾驶场景中的可迁移性?

相比起大多数预测算法在场景迁移中的无力,人类早已掌握了驾驶的精髓。当一个新手驾驶员在某一个驾驶场景练习驾驶时,他通过练习获得的驾驶经验以及驾驶技巧是可以迁移到其他场景上的。即使面对一个陌生的驾驶场景,人类依然能够复用以往的驾驶经验,毫不费力地驾驶车辆穿梭其间。

而现有的自动驾驶技术在面对陌生场景时的迁移能力与人类驾驶员之间仍然存在明显的差距。人类神奇驾驶能力背后所蕴含的认知和决策机制,自然而然地引起技术研究人员的好奇心。

受认知科学(cognition science)研究的启发,笔者观察到人类在密集的交通流和复杂的环境中之所以拥有强大的知识迁移能力,主要受益于两种认知机制:

1)分层结构(hierarchy):将复杂的任务分解为多个简单的子任务;2)选择性注意(selective attention):在巨大的信息池中筛选识别出有效的、与任务相关的低维环境表征。

我们基于上述两种认知机制分析人类在驾驶过程中的驾驶行为,其决策过程是自然分层的。如图3所示,在上层的意图层面(high-level intention),人类开车时通常在做的一件事就是在不停寻找合适的“插入区域”。这些“插入区域”一般由车道线与道路参与者组成,在本文中将其称为Dynamic Insertion Area(DIA)。

文章的作者将每个DIA建立为一个结点(node),把所有节点进行有向连接便得到了一个语义图semantic graph。

在这样一个多智能体setting下的图表征中,车辆之间的交互行为由节点之间的连接edge所描述。而在底层的动作层面(low-level action),在决定了插入哪一个区域以后,人类将根据车辆当前以及历史的动力学状态,进行一系列的底层动作以实现目标。

从具体的方法上来看,文章中所提出的分层行为预测框架主要分为以下几个步骤:

1) 从环境中抓取动态插入区域(dynamic insertion area),并构建语义图(semantic graph)作为环境的一种通用表征(generic representation)。2) 提出语义图网络(semantic graph network,SGN),对语义图中各个车辆之间的交互行为进行理解推理,预测出每个车辆未来将要插入的区域,以及所需要的时间以及行驶路程。其数学表示以及loss设计为:

3) 提出编码解码网络(encoder decoder network,EDN),在预测出的意图intention基础上,对每辆车未来具体的行驶轨迹进行生成预测。其数学表示以及loss设计为:

这种分层的任务划分方式,不仅大大降低了学习难度,也通过对于每一个子任务(sub-task)选取通用的环境表征,使得各个子策略(sub-policy)可以跨场景地泛化学习。

3. 如何使得预测模型能够自适应地捕捉驾驶行为的差异?

人类行为天然是异质的、随机的和随时间变化的(heterogeneous, stochastic, and time-varying)。不同的驾驶场景也会产生不同的驾驶模式(driving pattern)。捕捉驾驶行为的个体以及环境差异,有益于进一步提升预测方法的精度以及泛化能力。因此,文中使用一个在线自适应模块(online adaptation)将个体以及场景的差异注入模型当中。

在线自适应的原理是,虽然人类驾驶员之间不能够直接进行沟通与交流,但其历史的驾驶行为(historic behavior)暴露了其个体的驾驶特点。通过挖掘历史行为中的线索,我们可以对模型参数进行微调,以更好地贴合个体的驾驶行为。

具体而言,本文使用了改进的拓展卡尔曼滤波(Modified Extended Kalman Filter, MEKF)以对模型参数进行在线更新。我们将模型参数视为想要估计的state,预测出的历史轨迹作为prediction,观察到的历史真实轨迹作为observation,对模型参数进行最优估计。其数学表示如下:

4. 实验验证

本文在真实的人类驾驶数据集INTERACTION DATASET中对所提出的方法进行验证,以测试所提出方法的预测精度,迁移能力,以及自适应能力。该论文中对每个模块进行了大量的ablation study以寻找最优的模型结构,数据表征,以及超参数,本文简略地介绍案例分析以及性能比较。细节实验请参考文章末尾列出的原文。

4.1 案例分析

首先,本文给出三个案例分析以展示预测效果:

1)一次交互:在交叉路口中,自车与其他车辆交互,通过共同的冲突点(conflict point);

2)系列交互:在交叉路口中,自车与其他车辆交互,通过一系列冲突点;

3)场景迁移:将自车直接迁移到环岛场景,自车与其他车辆交互,通过冲突点。

分类:

决策智能

技术点:

相关文章:

© 版权声明
THE END
喜欢就支持一下吧
点赞55赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容