发明

基于多智能体强化学习的区域交通优化控制方法及系统2025

2024-02-04 07:16:20 发布于四川 0
  • 申请专利号:CN202311412460.0
  • 公开(公告)日:2025-04-29
  • 公开(公告)号:CN117475621A
  • 申请人:山东大学
摘要:本公开提供了基于多智能体强化学习的区域交通优化控制方法及系统,涉及区域交通控制技术领域,单智能体动作价值网络采用集中式训练、分布式执行,包括:将所有交叉口的局部状态观测作为输入,输入至单智能体的动作价值网络中,使用多头注意力机制对交通区域某T时刻的各个交叉口重要程度分配权重,利用超网络对多头注意力机制产生的高维度数据进行融合,分布式输出各个动作的价值,选取最大价值所对应的动作,决策出各个交叉口在全局下的最优动作,实现对区域交通的最优控制。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117475621 A (43)申请公布日 2024.01.30 (21)申请号 202311412460.0 (22)申请日 2023.10.27 (71)申请人 山东大学 地址 250061 山东省济南市历下区经十路 17923号 (72)发明人 朱文兴 龚宝林 张韬  (74)专利代理机构 济南圣达知识产权代理有限 公司 37221 专利代理师 于凤洋 (51)Int.Cl. G08G 1/01 (2006.01) G06N 3/04 (2023.01) G06N 3/08 (2023.01) 权利要求书2页 说明书7页 附图3页 (54)发明名称 基于多智能体强化学习的区域交通优化控 制方法及系统 (57)摘要 本公开提供了基于多智能体强化学习的区 域交通优化控制方法及系统,涉及区域交通控制 技术领域,单智能体动作价值网络采用集中式训 练、分布式执行,包括:将所有交叉口的局部状态 观测作为输入,输入至单智能体的动作价值网络 中,使用多头注意力机制对交通区域某T时刻的 各个交叉口重要程度分配权重,利用超网络对多 头注意力机制产生的高维度数据进行融合,分布 式输出各个动作的价值,选取最大价值所对应的 动作,决策出各个交叉口在全局下的最优动作, 实现对区域交通的最优控制。 A 1 2 6 5 7 4 7 1 1 N C CN 117475621 A