发明

一种基于驾驶员个性化的拟人变道轨迹优化方法

2023-08-06 07:25:58 发布于四川 8
  • 申请专利号:CN202310592745.0
  • 公开(公告)日:2023-08-04
  • 公开(公告)号:CN116534055A
  • 申请人:同济大学
摘要:本发明涉及一种基于驾驶员个性化的拟人变道轨迹优化方法,包括:根据车辆变道行为决策的起点的车辆状态,构建变道轨迹的约束,通过遍历所有可能的变道行为决策的终点的车辆状态,生成候选变道轨迹;构建最大熵逆强化学习模型,所述最大熵逆强化学习模型的奖励函数由一组基函数组成,基函数从驾驶安全、个性化驾驶风格两个方面进行设计,保证车辆变道的安全性和驾驶风格个性化,同时基函数的系数通过逆强化学习进行确定;基于人类驾驶员示范轨迹对最大熵逆强化学习模型进行拟人化训练;基于训练完成的最大熵逆强化学习模型的奖励函数对候选变道轨迹进行评估,选择最优变道轨迹。与现有技术相比,本发明具有拟人化、个性化、安全性强等优点。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116534055 A (43)申请公布日 2023.08.04 (21)申请号 202310592745.0 (22)申请日 2023.05.24 (71)申请人 同济大学 地址 200092 上海市杨浦区四平路1239号 (72)发明人 褚洪庆 庄和健 高炳钊 陈虹  (74)专利代理机构 上海科盛知识产权代理有限 公司 31225 专利代理师 宣慧兰 (51)Int.Cl. B60W 60/00 (2020.01) B60W 50/00 (2006.01) B60W 40/09 (2012.01) B60W 30/18 (2012.01) 权利要求书3页 说明书9页 附图2页 (54)发明名称 一种基于驾驶员个性化的拟人变道轨迹优 化方法 (57)摘要 本发明涉及一种基于驾驶员个性化的拟人 变道轨迹优化方法,包括 :根据车辆变道行为决 策的起点的车辆状态,构建变道轨迹的约束,通 过遍历所有可能的变道行为决策的终点的车辆 状态,生成候选变道轨迹;构建最大熵逆强化学 习模型,所述最大熵逆强化学习模型的奖励函数 由一组基函数组成,基函数从驾驶安全、个性化 驾驶风格两个方面进行设计,保证车辆变道的安 全性和驾驶风格个性化,同时基函数的系数通过 逆强化学习进行确定;基于人类驾驶员示范轨迹 对最大熵逆强化学习模型进行拟人化训练;基于 A 训练完成的最大熵逆强化学习模型的奖励函数 5 对候选变道轨迹进行评估