发明

一种聚焦样本特征间距的全生命周期语音情感识别方法

2023-08-31 07:28:27 发布于四川 1
  • 申请专利号:CN202310794609.X
  • 公开(公告)日:2025-07-15
  • 公开(公告)号:CN116645980A
  • 申请人:南开大学
摘要:本发明涉及计算机处理技术领域,更具体地,涉及一种聚焦样本特征间距的全生命周期语音情感识别方法。在预训练阶段,本发明引入大规模预训练模型提取更为准确的语音表征;在微调阶段,通过交叉熵损失和有监督对比学习损失加权求和的结果,指导模型进行微调,使模型学习到的样本表征间距获得改善;在推理阶段,首先构造数据存储集合,用来存储训练集和验证集的样本表征及样本标签,为进一步利用改善后的样本间距,通过K最近邻检索增强的方法,检索得到数据存储集合中与测试样本最相似的K个样本,将检索得到的标签分布与模型对于测试样本的推理分布结果进行加权求和,得到测试样本的最终预测标签。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116645980 A (43)申请公布日 2023.08.25 (21)申请号 202310794609.X (22)申请日 2023.06.30 (71)申请人 南开大学 地址 300000 天津市南开区卫津路94号 (72)发明人 秦勇 王雪琛 赵石顽 王卉  周家名 贺佳贝  (74)专利代理机构 合肥晨创知识产权代理事务 所(普通合伙) 34162 专利代理师 康培培 (51)Int.Cl. G10L 25/63 (2013.01) G10L 25/27 (2013.01) G10L 25/03 (2013.01) 权利要求书2页 说明书6页 附图1页 (54)发明名称 一种聚焦样本特征间距的全生命周期语音 情感识别方法 (57)摘要 本发明涉及计算机处理技术领域 ,更具体 地,涉及一种聚焦样本特征间距的全生命周期语 音情感识别方法。在预训练阶段,本发明引入大 规模预训练模型提取更为准确的语音表征;在微 调阶段,通过交叉熵损失和有监督对比学习损失 加权求和的结果,指导模型进行微调,使模型学 习到的样本表征间距获得改善;在推理阶段,首 先构造数据存储集合,用来存储训练集和验证集 的样本表征及样本标签,为进一步利用改善后的 样本间距,通过K最近邻检索增强的方法,检索得 到数据存储集合中与测试样本最相似的K个样 A 本,将检索得到的标签分布与模型对于测试样本 0 的推理分布结果进行加权

最新专利