发明

一种基于逆强化学习的驾驶交互行为中社会性评价方法2025

2024-06-01 07:56:45 发布于四川 1
  • 申请专利号:CN202410116481.6
  • 公开(公告)日:2025-06-06
  • 公开(公告)号:CN118095063A
  • 申请人:同济大学
摘要:本发明涉及一种基于逆强化学习的驾驶交互行为中社会性评价方法,包括以下步骤:构建基于博弈论的交互行为模型,包括设计博弈参与对象,设计博弈行为,设计博弈收益函数,对所述模型进行求解得到交互轨迹;利用逆强化学习算法辨识交互行为模型中的社会性参数,进而评价交互过程中的社会性。与现有技术相比,本发明具有能够兼顾社会性与多层次链式动作依赖关系,能够从技术层面解析人机混行、社会性驾驶行为与循规驾驶行为偏差大、且危险度高的复杂强交互场景等优点。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 118095063 A (43)申请公布日 2024.05.28 (21)申请号 202410116481.6 (22)申请日 2024.01.26 (71)申请人 同济大学 地址 200092 上海市杨浦区四平路1239号 (72)发明人 田野 刘懿如 孙剑 赵晓聪  (74)专利代理机构 上海科盛知识产权代理有限 公司 31225 专利代理师 蔡彭君 (51)Int.Cl. G06F 30/27 (2020.01) G06F 119/02 (2020.01) 权利要求书2页 说明书8页 附图5页 (54)发明名称 一种基于逆强化学习的驾驶交互行为中社 会性评价方法 (57)摘要 本发明涉及一种基于逆强化学习的驾驶交 互行为中社会性评价方法,包括以下步骤:构建 基于博弈论的交互行为模型,包括设计博弈参与 对象,设计博弈行为,设计博弈收益函数,对所述 模型进行求解得到交互轨迹;利用逆强化学习算 法辨识交互行为模型中的社会性参数,进而评价 交互过程中的社会性。与现有技术相比,本发明 具有能够兼顾社会性与多层次链式动作依赖关 系,能够从技术层面解析人机混行、社会性驾驶 行为与循规驾驶行为偏差大、且危险度高的复杂 强交互场景等优点。 A 3 6 0 5 9 0 8 1 1 N C CN 118095063 A 权 利 要 求 书

最新专利