发明

机器学习装置、控制装置以及机器学习方法2024

2024-04-16 07:32:50 发布于四川 0
  • 申请专利号:CN202010287685.8
  • 公开(公告)日:2024-04-12
  • 公开(公告)号:CN111830904A
  • 申请人:发那科株式会社
摘要:本发明提供一种机器学习装置、控制装置以及机器学习方法。机器学习装置进行如下强化学习:在多个条件下驱动对电动机进行控制的伺服控制装置,并对设置于伺服控制装置的使至少一个特定频率成分衰减的至少一个滤波器的系数进行优化,具有:状态信息取得部,其取得状态信息,状态信息包含频率特性计算装置的计算结果、滤波器的系数、多个条件;行为信息输出部,其将行为信息输出给滤波器,行为信息包含状态信息所包含的系数的调整信息;回报输出部,其根据计算结果分别求出多个条件下的评价值,并将这些评价值之和的值作为回报来进行输出;价值函数更新部,其根据由回报输出部输出的回报值、状态信息、行为信息来更新行为价值函数。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111830904 A (43)申请公布日 2020.10.27 (21)申请号 202010287685.8 (22)申请日 2020.04.13 (30)优先权数据 2019-076851 2019.04.15 JP (71)申请人 发那科株式会社 地址 日本山梨县 (72)发明人 恒木亮太郎 猪饲聪史  (74)专利代理机构 北京银龙知识产权代理有限 公司 11243 代理人 曾贤伟 范胜杰 (51)Int.Cl. G05B 19/404(2006.01) 权利要求书2页 说明书19页 附图12页 (54)发明名称 机器学习装置、控制装置以及机器学习方法 (57)摘要 本发明提供一种机器学习装置、控制装置以 及机器学习方法。机器学习装置进行如下强化学 习:在多个条件下驱动对电动机进行控制的伺服 控制装置,并对设置于伺服控制装置的使至少一 个特定频率成分衰减的至少一个滤波器的系数 进行优化,具有:状态信息取得部,其取得状态信 息,状态信息包含频率特性计算装置的计算结 果、滤波器的系数、多个条件;行为信息输出部, 其将行为信息输出给滤波器,行为信息包含状态 信息所包含的系数的调整信息;回报输出部,其 根据计算结果分别求出多个条件下的评价值,并 将这些评价值之和的值作为回报来进行输出;价 A 值函数更新部,其根据由回报输出部输出的

最新专利