发明

一种模型训练方法及装置2025

2024-04-11 07:23:28 发布于四川 2
  • 申请专利号:CN202311665327.6
  • 公开(公告)日:2025-11-07
  • 公开(公告)号:CN117853839A
  • 申请人:人工智能与数字经济广东省实验室(深圳)
摘要:本申请提供了一种模型训练方法及装置。所述方法包括:获取各摄像设备采集的工作场景的第一图像,并提取各第一图像的第一语义信息;根据各第一图像和对应的第一语义信息、摄像设备的位姿信息,构建工作场景模型;从工作场景模型中获取多个指定视角的第二图像和对应的第二语义信息;针对各第二语义信息,确定第二语义信息与目标物体的文本特征之间的相似度,获得第一相似度信息;利用各第二图像、各第二语义信息和各第一相似度信息,训练动作预测模型,直至动作预测模型输出的针对指令的预测动作与专家动作之间的差异值小于预设阈值,获得已训练的动作预测模型。本申请能够提高模型的泛化能力,模型能够应用于不同的任务中。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117853839 A (43)申请公布日 2024.04.09 (21)申请号 202311665327.6 (22)申请日 2023.12.06 (71)申请人 人工智能与数字经济广东省实验室 (深圳) 地址 518000 广东省深圳市光明区玉塘街 道科润大厦 (72)发明人 卓凡 于非 贺颖  (74)专利代理机构 深圳中一联合知识产权代理 有限公司 44414 专利代理师 万凯君 (51)Int.Cl. G06V 10/774 (2022.01) G06V 10/40 (2022.01) G06V 10/74 (2022.01) G06N 3/006 (2023.01) 权利要求书3页 说明书11页 附图4页 (54)发明名称 一种模型训练方法及装置 (57)摘要 本申请提供了一种模型训练方法及装置。所 述方法包括:获取各摄像设备采集的工作场景的 第一图像,并提取各第一图像的第一语义信息; 根据各第一图像和对应的第一语义信息、摄像设 备的位姿信息,构建工作场景模型;从工作场景 模型中获取多个指定视角的第二图像和对应的 第二语义信息;针对各第二语义信息,确定第二 语义信息与目标物体的文本特征之间的相似度, 获得第一相似度信息;利用各第二图像、各第二 语义信息和各第一相似度信息,训练动作预测模 型,直至动作预测模型输出的针对指令的预测动 作

最新专利