发明

一种神经网络模型的训练方法、装置、设备及存储介质

2022-10-24 10:21:49 发布于四川 0
  • 申请专利号:CN202110172561.X
  • 公开(公告)日:2025-05-06
  • 公开(公告)号:CN114943330A
  • 申请人:广州视源电子科技股份有限公司|||广州视源人工智能创新研究院有限公司
摘要:本发明公开了一种神经网络模型的训练方法、装置、设备及存储介质。本发明实施例提供的神经网络模型的训练方法,基于训练样本的特征向量的L2范数挖掘训练数据中的难样本,为该难样本的交叉熵损失值配置相应的权重,让模型在训练过程中更多地关注到难样本的学习,进而提高神经网络模型在实际应用过程中的泛化性。此外,基于训练样本的特征向量的L2范数挖掘训练数据中的难样本,无需计算训练样本间的相似度和排序操作,节省了计算资源,提高了训练效率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114943330 A (43)申请公布日 2022.08.26 (21)申请号 202110172561.X (22)申请日 2021.02.08 (71)申请人 广州视源电子科技股份有限公司 地址 510530 广东省广州市黄埔区云埔四 路6号 申请人 广州视源人工智能创新研究院有限 公司 (72)发明人 熊凯  (74)专利代理机构 北京品源专利代理有限公司 11332 专利代理师 孟金喆 (51)Int.Cl. G06N 3/08 (2006.01) G06K 9/62 (2022.01) G06N 3/04 (2006.01) 权利要求书3页 说明书15页 附图5页 (54)发明名称 一种神经网络模型的训练方法、装置、设备 及存储介质 (57)摘要 本发明公开了一种神经网络模型的训练方 法、装置、设备及存储介质。本发明实施例提供的 神经网络模型的训练方法,基于训练样本的特征 向量的L2范数挖掘训练数据中的难样本,为该难 样本的交叉熵损失值配置相应的权重,让模型在 训练过程中更多地关注到难样本的学习,进而提 高神经网络模型在实际应用过程中的泛化性。此 外,基于训练样本的特征向量的L2范数挖掘训练 数据中的难样本,无需计算训练样本间的相似度 和排序操作,节省了计算资源,提高了训练效率。 A 0 3 3 3 4 9 4 1

最新专利