发明

一种基于迁移学习的强化学习安全控制方法2025

2024-06-01 08:04:19 发布于四川 3
  • 申请专利号:CN202410350942.6
  • 公开(公告)日:2025-05-02
  • 公开(公告)号:CN118092185A
  • 申请人:哈尔滨工业大学
摘要:一种基于迁移学习的强化学习安全控制方法,它属于智能控制技术领域。本发明解决了采用现有深度强化学习方法对车辆运动进行控制的安全性无法得到保证的问题。本发明方法为:步骤一、建立迁移学习的源系统模型;步骤二、建立车辆运动控制仿射动态系统模型,即目标系统模型;步骤三、利用源系统模型学习车辆运动控制仿射动态系统模型中的不确定性;步骤四、将源系统模型的控制策略迁移到目标系统模型,并结合步骤三中获得的不确定性对车辆运动进行控制。本发明方法可以应用于智能控制技术领域。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 118092185 A (43)申请公布日 2024.05.28 (21)申请号 202410350942.6 (22)申请日 2024.03.26 (71)申请人 哈尔滨工业大学 地址 150001 黑龙江省哈尔滨市南岗区西 大直街92号 (72)发明人 吴立刚 吴承伟 张权麒 孙光辉  刘健行  (74)专利代理机构 哈尔滨市松花江联合专利商 标代理有限公司 23213 专利代理师 岳昕 (51)Int.Cl. G05B 13/04 (2006.01) 权利要求书3页 说明书12页 附图7页 (54)发明名称 一种基于迁移学习的强化学习安全控制方 法 (57)摘要 一种基于迁移学习的强化学习安全控制方 法,它属于智能控制技术领域。本发明解决了采 用现有深度强化学习方法对车辆运动进行控制 的安全性无法得到保证的问题。本发明方法为: 步骤一、建立迁移学习的源系统模型;步骤二、建 立车辆运动控制仿射动态系统模型,即目标系统 模型;步骤三、利用源系统模型学习车辆运动控 制仿射动态系统模型中的不确定性;步骤四、将 源系统模型的控制策略迁移到目标系统模型,并 结合步骤三中获得的不确定性对车辆运动进行 控制。本发明方法可以应用于智能控制技术领 A 域。 5 8 1 2 9 0 8 1 1 N C CN 118092185 A 权 利 要 求 书

最新专利