一种基于循环神经网络的自评估机器人任务中错误可知的策略学习方法
- 申请专利号:CN202211451138.4
- 公开(公告)日:2025-04-15
- 公开(公告)号:CN115723132A
- 申请人:浙江大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115723132 A (43)申请公布日 2023.03.03 (21)申请号 202211451138.4 (22)申请日 2022.11.20 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 王越 许可淳 熊蓉 (74)专利代理机构 杭州中成专利事务所有限公 司 33212 专利代理师 李亦慈 唐银益 (51)Int.Cl. B25J 9/16 (2006.01) B25J 15/08 (2006.01) G06N 3/0442 (2023.01) G06N 3/0455 (2023.01) G06N 3/08 (2023.01) 权利要求书1页 说明书4页 附图1页 (54)发明名称 一种基于循环神经网络的自评估机器人任 务中错误可知的策略学习方法 (57)摘要 本发明公开了一种基于循环神经网络的自 评估机器人任务中错误可知的策略学习方法。本 发明针对具有自评估模块的机器人任务可以在 执行动作之前评估该动作的特性,充分利用动作 的自评估结果,将其建模到错误可知的策略学习 中,利用循环神经网络隐式地编码观测和评估的 记忆,使得策略本身具有基于之前的错误尝试进 行分布更新的能力,从而使得最终执行的动作更 加安全可靠。相比于通用的排序策略,本发明考 虑了之前尝试的自评估结果对动作概率值分布 的影响,从而
最新专利
- 一种持镜机器人视觉伺服方法及系统公开日期:2025-05-06公开号:CN117901090A申请号:CN202311805261.6一种持镜机器人视觉伺服方法及系统
- 发布时间:2024-04-21 07:46:040
- 申请号:CN202311805261.6
- 公开号:CN117901090A
- 机器人灵巧手及机器人公开日期:2025-05-06公开号:CN116766239A申请号:CN202310946504.1机器人灵巧手及机器人
- 发布时间:2023-09-24 07:26:420
- 申请号:CN202310946504.1
- 公开号:CN116766239A
- 一种冗余度双机械臂相互避障方法、装置及存储介质公开日期:2025-05-06公开号:CN116728401A申请号:CN202310346250.X一种冗余度双机械臂相互避障方法、装置及存储介质
- 发布时间:2023-09-14 07:13:050
- 申请号:CN202310346250.X
- 公开号:CN116728401A
- 一种转运机器人夹爪公开日期:2025-05-06公开号:CN116690625A申请号:CN202310837279.8一种转运机器人夹爪
- 发布时间:2023-09-07 07:28:560
- 申请号:CN202310837279.8
- 公开号:CN116690625A
- 一种重症监护室智能护理机器人公开日期:2025-05-06公开号:CN116442259A申请号:CN202310483620.4一种重症监护室智能护理机器人
- 发布时间:2023-07-21 07:15:590
- 申请号:CN202310483620.4
- 公开号:CN116442259A
- 基于关节位置伺服的机器人足地交互力控制方法及系统公开日期:2025-05-06公开号:CN116352707A申请号:CN202310201288.8基于关节位置伺服的机器人足地交互力控制方法及系统
- 发布时间:2023-07-03 10:05:430
- 申请号:CN202310201288.8
- 公开号:CN116352707A