发明

基于深度强化学习的瓶颈区换道控制方法、设备及介质2024

2023-11-19 07:18:34 发布于四川 1
  • 申请专利号:CN202310808834.4
  • 公开(公告)日:2024-12-10
  • 公开(公告)号:CN117079450A
  • 申请人:重庆邮电大学
摘要:本发明公开了基于深度强化学习的瓶颈区换道控制方法、设备及介质,通过选取一定比例的车辆使其提前换道来避免临近瓶颈区车辆集中换道而导致通行能力下降的发生,通过奖励函数的设计实现了每条车道车辆密度的平均,以最大限度避免了集中换道和为了追求速度的频繁换道行为,保证了瓶颈区交通流的稳定。此外,通过DQN网络与环境的交互更新训练,得到最优换道策略,该最优换道策略可协调控制瓶颈区车辆的换道行为,通过在瓶颈区上游进行提前换道,避免临近瓶颈区车辆集中换道导致交通拥堵的发生,有效地解决瓶颈区通行能力下降的问题。本发明的瓶颈区换到控制方法与传统的基于交通流控制方案相比,减少了车辆的平均行程时间,提高了通行效率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117079450 A (43)申请公布日 2023.11.17 (21)申请号 202310808834.4 (22)申请日 2023.07.03 (71)申请人 重庆邮电大学 地址 400000 重庆市南岸区南山街道崇文 路2号 (72)发明人 段垚鑫 张慧 聂文迪 刘超凡  (74)专利代理机构 成都行之专利代理有限公司 51220 专利代理师 喻英 (51)Int.Cl. G08G 1/01 (2006.01) G08G 1/065 (2006.01) G08G 1/09 (2006.01) 权利要求书2页 说明书8页 附图2页 (54)发明名称 基于深度强化学习的瓶颈区换道控制方法、 设备及介质 (57)摘要 本发明公开了基于深度强化学习的瓶颈区 换道控制方法、设备及介质,通过选取一定比例 的车辆使其提前换道来避免临近瓶颈区车辆集 中换道而导致通行能力下降的发生,通过奖励函 数的设计实现了每条车道车辆密度的平均,以最 大限度避免了集中换道和为了追求速度的频繁 换道行为,保证了瓶颈区交通流的稳定。此外,通 过DQN网络与环境的交互更新训练,得到最优换 道策略,该最优换道策略可协调控制瓶颈区车辆 的换道行为,通过在瓶颈区上游进行提前换道, 避免临近瓶颈区车辆集中换道导致交通拥堵的 A 发生,有效地解决瓶颈区通行能力下降的问题。 0 本发明的瓶颈区换到控制方法与传统的基于交 5 4

最新专利