发明

一种无人机信息收集的控制方法、设备及介质2025

2023-10-13 07:15:19 发布于四川 3
  • 申请专利号:CN202310658911.2
  • 公开(公告)日:2025-08-08
  • 公开(公告)号:CN116859719A
  • 申请人:中国人民解放军国防科技大学
摘要:本发明公开了一种无人机信息收集的控制方法,包括:定义连续状态和动作空间下无人机进行信息收集的过程,将无人机对多个节点在给定时间内收集的信息的量最大化作为优化目标;将连续状态和动作空间下有状态估计误差的无人机信息收集的优化目标求解转化为稳健强化学习中的最优控制策略求解;利用基于策略梯度的稳健Actor‑Critic学习算法获取连续状态和动作空间下有状态估计误差时的最优控制策略。本发明首次提出了如何处理在连续状态和动作空间下、无人机状态存在估计误差且被收集信息节点信息未知的综合情况下的信息收集自主控制问题,并将该问题转化为稳健强化学习中的最优控制策略求解,最后利用稳健Actor‑Critic学习算法进行解算,从而扩展了应用场景。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116859719 A (43)申请公布日 2023.10.10 (21)申请号 202310658911.2 (22)申请日 2023.06.05 (71)申请人 中国人民解放军国防科技大学 地址 410073 湖南省长沙市开福区德雅路 109号 (72)发明人 徐坤 但阳鹏 段超凡 杨帆  (74)专利代理机构 武汉东喻专利代理事务所 (普通合伙) 42224 专利代理师 方可 (51)Int.Cl. G05B 13/04 (2006.01) 权利要求书2页 说明书11页 附图1页 (54)发明名称 一种无人机信息收集的控制方法、设备及介 质 (57)摘要 本发明公开了一种无人机信息收集的控制 方法,包括 :定义连续状态和动作空间下无人机 进行信息收集的过程,将无人机对多个节点在给 定时间内收集的信息的量最大化作为优化目标; 将连续状态和动作空间下有状态估计误差的无 人机信息收集的优化目标求解转化为稳健强化 学习中的最优控制策略求解;利用基于策略梯度 的稳健Actor‑Critic学习算法获取连续状态和 动作空间下有状态估计误差时的最优控制策略。 本发明首次提出了如何处理在连续状态和动作 空间下、无人机状态存在估计误差且被收集信息 A 节点信息未知的综合情况下的信息收集自主控 9 制问题,并将该问题转化为稳健强化学习中的最 1 7 9 优控制策略求解,最后利用稳健Actor‑Critic学 5 8 6 习算法进

最新专利