发明

基于示教奖励状态机与残差强化学习的机器人装配学习方法2025

2024-04-16 07:26:07 发布于四川 2

申请专利号：CN202410096459.X
公开（公告）日：2025-10-03
公开（公告）号：CN117863152A
申请人：华南理工大学|||佛山纽欣肯智能科技有限公司

摘要：本发明提供了一种基于示教奖励状态机与残差强化学习的机器人装配方法，属于机器人与智能制造领域，包括如下步骤：搭建机器人装配的硬件实物平台和强化学习训练的虚拟仿真环境；在实物平台通过拖拽示教采集装配过程中装配对象的6D位姿示教轨迹；抽象表示示教中的关键信息和状态迁移，根据状态机构建奖励函数以提高学习效率；建立基于导纳控制的残差强化学习方法，通过残差强化学习来优化导纳控制装配策略，提高机器人装配的安全性。本发明结合了示教奖励状态机和残差强化学习的优势，既能够通过示教快速引导机器人完成任务，又能够通过强化学习实现机器人在复杂环境中的自主学习和适应性提升，同时通过导纳控制提高了系统的安全性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117863152 A (43)申请公布日 2024.04.12 (21)申请号 202410096459.X (22)申请日 2024.01.24 (71)申请人华南理工大学地址 510640 广东省广州市天河区五山路 381号申请人佛山纽欣肯智能科技有限公司 (72)发明人肖睿宏　占宏　杨辰光　 (74)专利代理机构广州市华学知识产权代理有限公司 44245 专利代理师李斌 (51)Int.Cl. B25J 9/00 (2006.01) B25J 9/16 (2006.01) 权利要求书4页说明书10页附图3页 (54)发明名称基于示教奖励状态机与残差强化学习的机器人装配学习方法 (57)摘要本发明提供了一种基于示教奖励状态机与残差强化学习的机器人装配方法，属于机器人与智能制造领域，包括如下步骤：搭建机器人装配的硬件实物平台和强化学习训练的虚拟仿真环境；在实物平台通过拖拽示教采集装配过程中装配对象的6D位姿示教轨迹；抽象表示示教中的关键信息和状态迁移，根据状态机构建奖励函数以提高学习效率；建立基于导纳控制的残差强化学习方法，通过残差强化学习来优化导纳控制装配策略，提高机器人装配的安全性。本发明结合了示教奖励状态机和残差强化学习的优势，既能够 A 通过示教快速引导机器人完成任务，又能够通过 2 强化学习实现机器人在复杂环境中的自主学习 5

基于示教奖励状态机与残差强化学习的机器人装配学习方法2025

专利内容

最新专利

相关专利