发明

一种实时推荐无冲突停车位的深度强化学习方法

2023-06-01 07:09:40 发布于四川 1
  • 申请专利号:CN202211503162.8
  • 公开(公告)日:2024-12-20
  • 公开(公告)号:CN115830869A
  • 申请人:中国石油大学(华东)
摘要:本发明公开了一种实时推荐无冲突停车位的深度强化学习方法,该方法包括如下步骤:将实时收集的空置停车位置数据作为停车感知数据,输入在VCS服务器上搭建的强化学习PPO模型中,通过特征网络进行特征提取,预测车辆的社交环境;然后经过策略网络得到车辆相应的策略概率分布,并利用价值网络计算V值,进而对两个网络进行更新直至收敛;在此过程中,VCS服务器会计算车辆停车感知状态的奖励并利用预测得出的车辆下一状态为车辆提供合适的停车策略;此外,本发明考虑了真实情况,利用博弈规则为车辆提供备选方案,解决了真实场景下因车辆增加,交通拥堵导致的寻找停车位困难以及停车位冲突的问题。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115830869 A (43)申请公布日 2023.03.21 (21)申请号 202211503162.8 (22)申请日 2022.11.28 (71)申请人 中国石油大学(华东) 地址 266580 山东省青岛市黄岛区长江西 路66号 (72)发明人 李昕 类兴华 刘秀文 王富胜  赵晓飞  (74)专利代理机构 青岛锦佳专利代理事务所 (普通合伙) 37283 专利代理师 朱玉建 (51)Int.Cl. G08G 1/01 (2006.01) G08G 1/14 (2006.01) G06N 3/092 (2023.01) 权利要求书4页 说明书7页 附图2页 (54)发明名称 一种实时推荐无冲突停车位的深度强化学 习方法 (57)摘要 本发明公开了一种实时推荐无冲突停车位 的深度强化学习方法,该方法包括如下步骤:将 实时收集的空置停车位置数据作为停车感知数 据,输入在VCS服务器上搭建的强化学习PPO模型 中,通过特征网络进行特征提取,预测车辆的社 交环境;然后经过策略网络得到车辆相应的策略 概率分布,并利用价值网络计算V值,进而对两个 网络进行更新直至收敛;在此过程中,VCS服务器 会计算车辆停车感知状态的奖励并利用预测得 出的车辆下一状态为车辆提供合适的停车策略; 此外,本发明考虑了真实情况,利用博弈规则为 A 车辆提供备选方案,解决了真实场景下因车辆增 9

最新专利