发明

一种无人机信息收集的控制方法、设备及介质2025

2023-10-13 07:15:19 发布于四川 3

申请专利号：CN202310658911.2
公开（公告）日：2025-08-08
公开（公告）号：CN116859719A
申请人：中国人民解放军国防科技大学

摘要：本发明公开了一种无人机信息收集的控制方法，包括：定义连续状态和动作空间下无人机进行信息收集的过程，将无人机对多个节点在给定时间内收集的信息的量最大化作为优化目标；将连续状态和动作空间下有状态估计误差的无人机信息收集的优化目标求解转化为稳健强化学习中的最优控制策略求解；利用基于策略梯度的稳健Actor‑Critic学习算法获取连续状态和动作空间下有状态估计误差时的最优控制策略。本发明首次提出了如何处理在连续状态和动作空间下、无人机状态存在估计误差且被收集信息节点信息未知的综合情况下的信息收集自主控制问题，并将该问题转化为稳健强化学习中的最优控制策略求解，最后利用稳健Actor‑Critic学习算法进行解算，从而扩展了应用场景。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116859719 A (43)申请公布日 2023.10.10 (21)申请号 202310658911.2 (22)申请日 2023.06.05 (71)申请人中国人民解放军国防科技大学地址 410073 湖南省长沙市开福区德雅路 109号 (72)发明人徐坤　但阳鹏　段超凡　杨帆　 (74)专利代理机构武汉东喻专利代理事务所 (普通合伙) 42224 专利代理师方可 (51)Int.Cl. G05B 13/04 (2006.01) 权利要求书2页说明书11页附图1页 (54)发明名称一种无人机信息收集的控制方法、设备及介质 (57)摘要本发明公开了一种无人机信息收集的控制方法，包括：定义连续状态和动作空间下无人机进行信息收集的过程，将无人机对多个节点在给定时间内收集的信息的量最大化作为优化目标；将连续状态和动作空间下有状态估计误差的无人机信息收集的优化目标求解转化为稳健强化学习中的最优控制策略求解；利用基于策略梯度的稳健Actor‑Critic学习算法获取连续状态和动作空间下有状态估计误差时的最优控制策略。本发明首次提出了如何处理在连续状态和动作空间下、无人机状态存在估计误差且被收集信息 A 节点信息未知的综合情况下的信息收集自主控 9 制问题，并将该问题转化为稳健强化学习中的最 1 7 9 优控制策略求解，最后利用稳健Actor‑Critic学 5 8 6 习算法进

一种无人机信息收集的控制方法、设备及介质2025

专利内容

最新专利

相关专利