发明

基于示教奖励状态机与残差强化学习的机器人装配学习方法2025

2024-04-16 07:26:07 发布于四川 2
  • 申请专利号:CN202410096459.X
  • 公开(公告)日:2025-10-03
  • 公开(公告)号:CN117863152A
  • 申请人:华南理工大学|||佛山纽欣肯智能科技有限公司
摘要:本发明提供了一种基于示教奖励状态机与残差强化学习的机器人装配方法,属于机器人与智能制造领域,包括如下步骤:搭建机器人装配的硬件实物平台和强化学习训练的虚拟仿真环境;在实物平台通过拖拽示教采集装配过程中装配对象的6D位姿示教轨迹;抽象表示示教中的关键信息和状态迁移,根据状态机构建奖励函数以提高学习效率;建立基于导纳控制的残差强化学习方法,通过残差强化学习来优化导纳控制装配策略,提高机器人装配的安全性。本发明结合了示教奖励状态机和残差强化学习的优势,既能够通过示教快速引导机器人完成任务,又能够通过强化学习实现机器人在复杂环境中的自主学习和适应性提升,同时通过导纳控制提高了系统的安全性。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117863152 A (43)申请公布日 2024.04.12 (21)申请号 202410096459.X (22)申请日 2024.01.24 (71)申请人 华南理工大学 地址 510640 广东省广州市天河区五山路 381号 申请人 佛山纽欣肯智能科技有限公司 (72)发明人 肖睿宏 占宏 杨辰光  (74)专利代理机构 广州市华学知识产权代理有 限公司 44245 专利代理师 李斌 (51)Int.Cl. B25J 9/00 (2006.01) B25J 9/16 (2006.01) 权利要求书4页 说明书10页 附图3页 (54)发明名称 基于示教奖励状态机与残差强化学习的机 器人装配学习方法 (57)摘要 本发明提供了一种基于示教奖励状态机与 残差强化学习的机器人装配方法,属于机器人与 智能制造领域,包括如下步骤:搭建机器人装配 的硬件实物平台和强化学习训练的虚拟仿真环 境;在实物平台通过拖拽示教采集装配过程中装 配对象的6D位姿示教轨迹;抽象表示示教中的关 键信息和状态迁移,根据状态机构建奖励函数以 提高学习效率;建立基于导纳控制的残差强化学 习方法,通过残差强化学习来优化导纳控制装配 策略,提高机器人装配的安全性。本发明结合了 示教奖励状态机和残差强化学习的优势,既能够 A 通过示教快速引导机器人完成任务,又能够通过 2 强化学习实现机器人在复杂环境中的自主学习 5

最新专利