项目编号:????? 2007?????
基于因果推理的无人驾驶冗余决策模型研究
Research on Redundant Decision Model of Automotive Driving based on Causal Reasoning
项目研制单位:同济大学? 上海友道智途科技有限公司
主要研制人员:吴光强? 张显宏? 毛礼波? 李晓芸? 曾奇? 陈秋石? 张栋? 王浩
宗健壮? 毛瑞驰? 温高博? 厉逸航? 刘序阳? 胡汇泽? 陈浔杰??任猛
主题词:无人驾驶决策模型、冗余决策框架、强化学习、贝叶斯网络
1、研究内容介绍
- 本研究的目的意义
无人驾驶车辆行驶过程中面临着复杂不可控的交通环境(包括动态行人车辆、道路标志不清晰、红绿灯故障、城市改造建设等)、多变的气候条件(包括暴雨大雪、突现的强光等)、感知数据精度降低和部分模块失效等问题,极大地限制和影响无人驾驶车辆应用和运营。
目前的决策系统是以基于规则设计的有限状态机算法为主,基于规则的决策技术虽然能够在部分场景下较好完成汽车的无人驾驶任务,但当无人驾驶汽车实际面临复杂陌生的交通环境时,基于规则的决策技术由于规则复杂度等因素就显得捉襟见肘,极大地限制无人驾驶汽车的应用和运营。另一方面例如监督学习等基于神经网络的决策算法需要输入带有标签的数据,对数据进行标记涉及的工作量巨大,且算法过程缺乏可解释性。另外目前的决策系统主要以单一决策方法为主,较少进行学习算法与规则算法相结合的决策研究,决策一旦出现错误或者出现故障,将导致灾难性的后果或者导致整个系统停止运行。另外仅基于规则的决策难以完全覆盖所有场景,仅基于深度学习的决策存在“黑箱”难题,故而学习型算法与规则型算法结合的决策系统的开发是解决该问题的有效途径。
因此,为简化各种场景下规则的人工建立和数据标记的工作,提高复杂场景下无人驾驶汽车的适应性、提升泛化能力,使得无人驾驶汽车能够表现出更高的智能水平,处理陌生交通环境下的某些特殊情况,提高无人驾驶汽车决策的可靠性,结合深度学习的强化学习、贝叶斯网络的因果推理决策方法受到越来越多的关注。
上海友道智途科技有限公司依托洋山港“5G+L4”智能重卡项目的技术积累和成功经验,聚焦港口、厂区等特定场景与干线物流场景的L4级和L3级自动驾驶产品,具有丰富的商用车无人驾驶技术落地应用运营的经验与基础。通过产学研合作,开展基于因果推理的无人驾驶冗余决策模型的技术研究与开发工作,掌握国际领先的无人驾驶决策核心技术,开发具有自主知识产权的无人驾驶决策技术,实现冗余决策系统与整车无人驾驶系统的匹配和集成,为洋山港5G智能重卡的推广应用提供技术支持。
- 要解决的关键技术
(1)基于数据驱动的决策算法应用技术;
(2)结合静态与动态冗余的多种决策算法冗余架构设计技术;
(3)前车切入切出场景下速度规划技术;
(4)考虑安全性与高效性的路口决策技术;
(5)无人驾驶决策算法仿真、台架、实车验证与评价技术。
- 采用的技术路线和方法
根据研究内容,项目技术方案分为七个阶段:
(1)现状调研
国内外无人驾驶决策技术开发和应用现状研究,总结与无人驾驶决策技术相关的强化学习、贝叶斯网络、有限状态机等多方面的最新技术与应用现状,探索无人驾驶决策技术开发的技术难点和前沿理论。
(2)理论研究
分析典型的工况场景,分别设计基于强化学习、贝叶斯网络与规则的无人驾驶汽车决策模型,研究无人驾驶汽车自适应巡航速度规划算法,进行原理的验证,保证各个模块的有效性。
(3)算法集成
基于各模块核心算法研究,分析不同算法的性能效果与适用场景,设计具有静态冗余与动态冗余的决策系统软件架构,研究不同算法的判别机理,集成基于因果推理的无人驾驶冗余决策系统。
(4)驾驶模拟器(Driving Simulator,DS)仿真
根据典型工况场景,设计、搭建基于DS的仿真模型,并建立有效的评价指标,进行300km的DS仿真测试。
(5)台架试验
根据典型工况场景,设计虚拟环境下的试验工况条件,使用集成好的基于因果推理的无人驾驶冗余决策系统,在友道智途HILs台架进行测试试验,验证算法在理想条件下的效果。
(6)数据回放试验
根据典型工况场景,录制log进行数据回放并进行基于因果推理的无人驾驶冗余决策,建立评价函数,通过主客观对比分析对其优越性进行评估。
(7)实车试验
将本项目设计的基于因果推理的无人驾驶冗余决策系统代码嵌入友道智途无人驾驶系统,在目标车的配合下进行实车试验,分别通过主观与客观的评价方法对决策性能进行评估。
- 达到的效果和成果技术水平
(1)开发了基于因果推理的冗余决策模型;
(2)实现了高速公路下的换道决策与速度规划;
(3)实现了十字路口场景下的决策与规划;
(4)基于上述决策模型、技术框架的车辆行为决策规划系统,实现典型场景下的决策正确率不低于95%(当前有限测试场景下达到100%),决策时间不多于60ms的技术指标;
(5)搭建了决策算法DS仿真测试平台;
(6)提供多层级的冗余决策系统代码与说明;
(7)与原车目标版本算法在友道智途HILs台架与实车上进行了测试与比较,并进行日志回放测试;
(8)进行了基于DS的大规模测试验证;
(9)培养了掌握无人驾驶冗余决策核心技术的高层次专业技术人才,同时也补充并增强了智能重卡智驾平台的技术水平,为实现国际领先的基于数据驱动的无人驾驶决策方法落地提供技术支持。
- 附典型图表、数据、产品图说明
图1 HILs台架测试现场
表1 换道决策台架测试结果统计
?????????? 算法
统计指标 |
冗余决策算法 | 基于规则的算法 |
自车平均速度 | 18.20m/s | 17.00m/s |
换道决策时本车道前车平均相对距离 | 98.31m | 65.42m |
换道决策时本车道前车平均相对速度 | -16.90km/h | -10.8km/h |
评价指标得分 | 16.11 | 14.82 |
在HILs台架测试下基于因果推理的冗余高速公路换道行为决策算法具有良好的决策性能。使用了冗余决策的车辆更早地换到空旷车道上提高了车速,提升了整体的通行效率。
表2 自适应巡航台架测试结果统计
评价指标
场景 |
同济 | 友道智途 | ||||
(s) | (m/s2) | (m/s3) | (s) | (m/s2) | (m/s3) | |
1 | 6.01-6.17 | 0.1402 | 0.1536 | 3.71-4.12 | 0.4051 | 0.2031 |
2 | 0.2028 | 0.1629 | / | / | ||
3 | 0.3139 | 0.2286 | 0.3516 | 0.2168 | ||
4 | 0.1817 | 0.1749 | 0.3540 | 0.1747 |
在台架上测试的本项目设计的自适应巡航算法相比于原车速度规划算法的安全跟车距离更长,在行驶过程中更加安全且舒适性更高。
(a)自车与周车纵向绝对位置
(b)自车与周车行驶速度
(c)周车相对自车纵向距离
(d) 周车相对自车行驶速度
图2 东海大桥实车测试自车与周车运动响应
表3 东海大桥实车测试结果
算法
统计指标 |
冗余决策算法 |
自车平均车速 | 17.99m/s |
换道决策时本车道前车平均相对距离 | 68m |
换道决策时本车道前车平均相对速度 | -1.62km/h |
东海大桥是一个典型的高速公路驾驶场景,项目组将上述算法在该场景下基于友道的智能重卡进行了大规模应用与验证,验证冗余决策换道算法和自适应巡航控制算法的有效与先进性。
(a)自车与周车纵向绝对位置
(b)自车与周车行驶速度
图3 换道决策实车试验比较图
表4 换道决策实车测试结果
统计指标 | 冗余决策系统 | 原车决策系统 |
换道决策时前车平均相对距离 | 114.75m | 93.22m |
换道决策时前车平均相对速度 | -4.13m/s | -3.94m/s |
自车平均车速 | 14.66m/s | 13.51m/s |
存在碰撞风险的时间 | 0s | 3.1s |
评价指标得分 | 14.66 | 12.89 |
在实车上基于因果推理的冗余换道行为决策算法表现出了良好的决策效果与稳定性,做出的决策可以提高智能重卡的行驶效率与安全性能。
(a)自车与周车纵向绝对位置
(b)自车与周车行驶速度
图4 冗余换道决策大规模实车应用测试自车与周车运动响应
测试中出现了一次连续两次换道的情形,自车在等待目标车道后方四辆快车超越自车后采取了换道行为,并在换道后又遇到前方慢车,继而又进行了第二次换道,结果如图4和表5所示。
表5 复杂工况决策算法实车测试结果统计
算法
统计指标 |
冗余决策算法 |
第一次换道自车平均车速 | 18.20m/s |
第一次换道决策时本车道前车平均相对距离 | 72.20m |
第一次换道决策时本车道前车平均相对速度 | -2.31km/h |
第二次换道自车平均车速 | 18.51m/s |
第二次换道决策时本车道前车平均相对距离 | 88.10m |
第二次换道决策时本车道前车平均相对速度 | -4.48km/h |
经过实车测试与验证,本项目设计的基于因果推理的冗余换道行为决策算法目前在测试试验中没有被安全员进行接管,且在复杂多变的场景下做出的决策可以提高智能重卡的行驶效率与安全性能。
?? (a) 同济算法下自车加速度
(b) 原车功能算法下自车加速度
图5 自适应巡航实车试验比较图
表6 自适应巡航实车测试结果统计
评价指标
场景 |
(s) | (m/s2) | (m/s3) |
定速巡航 | 3.9-4.6 | 0.1181 | 0.1304 |
跟车场景 | 0.3021 | 0.1365 | |
较远处cut in场景 | 0.2918 | 0.2437 | |
较近处cut in场景 | 0.2867 | 0.2021 | |
连续cut in场景 | 0.3141 | 0.2292 |
经过实车测试,本项目设计的自适应巡航控制算法在东海大桥复杂多变的场景中具有较好的安全性和乘坐舒适性。
图6 复杂与极端工况DS仿真
(a) 自车与周车纵向绝对位置
(b)自车与周车行驶速度
图7 ?DS仿真结果图
表7 冗余决策算法DS仿真测试结果
算法
统计指标 |
冗余决策算法 |
自车平均速度 | 70km/h |
换道决策时本车道前车平均相对距离 | 40.58m |
换道决策时本车道前车平均相对速度 | -25.58km/h |
换道决策时目标车道前车平均相对距离 | 118.90m |
换道决策时目标车前平均相对速度 | 4.62km/h |
评价指标 | 16.58 |
在基于DS的仿真测试中,冗余换道行为决策算法表现出了良好的决策效果与稳定性。从仿真层面验证了冗余换道行为决策算法的可靠性。
表8 路口规划实车同济测试结果
?????? 评价指标
场景 |
加速度均方根 | 加加速度均方根 |
1 | 0.7678 | 0.8622 |
2 | 0.6650 | 0.7742 |
表9 路口规划实车原车测试结果
评价指标
场景 |
加速度均方根 | 加加速度均方根 |
1 | 0.6248 | 0.6260 |
2 | 1.0477 | 0.9314 |
综上所述,本项目设计的冗余决策规划算法在DS、台架与实车的测试试验中都表现出了良好的性能,对于智能重卡的安全性与通行效率有一定的提升。在客观数据的分析上,部分场景工况下的部分指标上要优于原车目标版本的功能,在测试工程师和安全员的主观评价上目前达到的效果不亚于原车目标版本功能表现。
2、技术创新点
(1)提出一种基于自然驾驶数据的换道样本制作方法;
(2)采用基于粗糙集理论的属性约简方法,使得用于贝叶斯推理的条件属性集最优;
(3)采用基于卡方值校验的方法对属性值进行离散,减小数据之间的相关性,使得决策策略更优;
(4)通过使用深度强化学习的方法可以处理复杂工况下多维度的信息;
(5)基于DQN的算法设计决策模型提高了训练效果与收敛速度;
(6)提出一种权衡跟车距离与车速的自适应巡航上层控制算法;
(7)采用基于S-t图和A*的速度搜索与分段加加速度的速度优化方法,使得算法能够灵活应对动态障碍物,并保证速度优化具有曲率级别连续性。
3、专利/论文/获奖情况
申请国家发明专利:
[1]一种车辆换道开始时刻的确定方法和装置。(受理号:202210712930.4,实质审查中)
[2]基于贝叶斯网络的高速公路换道决策方法。(受理号:202210085007.2,实质审查中)
已获国家计算机软件著作权:
[1]智能驾驶换道决策特征提取与样本制作软件。(登记号:2022SR0218202)
发表论文:
[1] Xianhong Zhang, Xuyang Liu, Xiaoyun Li, Guangqiang Wu. Lane Change Decision Algorithm Based on Deep-Q-Network for Autonomous Vehicles[C]. SAE WCX 2022. 2022-01-0084. (EI,Accession number:20221611970939)
[2] Qi Zeng, Guangqiang Wu, Libo Mao. A Support Vector Machine-Based ?Truck Discretionary Lane Changing Decision Model[C]. Slovenia. 2021 20th International Conference on Advanced Robotics (ICAR), 2021, 435-440. (EI,Accession number:20220811680351)
4、成果应用及经济效益预测
本项目结合强化学习与贝叶斯网络算法,搭建动静态冗余决策框架,开发出具有自主知识产权的无人驾驶决策系统,并配套提供高速道路物流场景下自适应巡航与社会道路十字路口场景速度规划算法,能够广泛适用于商用车在结构化道路行驶的场景,有效弥补我国在面向复杂工况的无人驾驶决策领域存在的规则有限的现状,能够加速无人驾驶决策系统研发与生产,协助友道智途实现商用车无人驾驶落地,具有优良的应用前景。
项目将在东海大桥开展35台以上车辆的无人化物流作业示范运行,每辆智能重卡年工作时间约2900小时左右,约运输5万标箱。通过部署本无人驾驶决策系统,可以减少20%的人工成本,生产效率提升约30%,且维护成本可以降低10%。本项目将产生巨大的经济和社会效益。