发明

行人环境下基于深度强化学习的机器人路径避碰规划方法

2023-07-03 10:12:50 发布于四川 3
  • 申请专利号:CN202310437715.2
  • 公开(公告)日:2025-06-20
  • 公开(公告)号:CN116360454A
  • 申请人:浙江大学
摘要:本发明公开了一种行人环境下基于深度强化学习的机器人路径避碰规划方法,属于深度学习与移动机器人导航技术领域。本发明融合多种碰撞算法生成由行人状态构成的行人轨迹数据集,利用编解码器对行人状态编解码后,与由马尔可夫元组获得的机器人当前状态与观测共同作为深度神经网络的输入,生成机器人的状态‑动作价值对的估计值;利用动作神经网络输出当前状态下机器人选择的最优动作,利用评价神经网络对机器人的状态‑动作进行打分,基于强化学习迭代训练。本发明在执行阶段,采用激光雷达获取周围环境数据,实现移动机器人在行人环境下的安全导航,有效解决了动态环境下机器人导航的短视与遮挡问题,提高了机器人避障行为的安全性、时效性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116360454 A (43)申请公布日 2023.06.30 (21)申请号 202310437715.2 (22)申请日 2023.04.18 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 张建明 曹晋瑜 朱骞 朱科  (74)专利代理机构 杭州求是专利事务所有限公 司 33200 专利代理师 郑海峰 (51)Int.Cl. G05D 1/02 (2020.01) 权利要求书2页 说明书6页 附图3页 (54)发明名称 行人环境下基于深度强化学习的机器人路 径避碰规划方法 (57)摘要 本发明公开了一种行人环境下基于深度强 化学习的机器人路径避碰规划方法,属于深度学 习与移动机器人导航技术领域。本发明融合多种 碰撞算法生成由行人状态构成的行人轨迹数据 集,利用编解码器对行人状态编解码后,与由马 尔可夫元组获得的机器人当前状态与观测共同 作为深度神经网络的输入,生成机器人的状态‑ 动作价值对的估计值;利用动作神经网络输出当 前状态下机器人选择的最优动作,利用评价神经 网络对机器人的状态‑动作进行打分,基于强化 学习迭代训练。本发明在执行阶段,采用激光雷 A 达获取周围环境数据,实现移动机器人在行人环 4 境下的安全导航,有效解决了动态环境下机器人 5 4 0 导航的短视与遮挡问题,提高了机器人避障行为 6 3 6 的安全性、时效性。 1 1

最新专利