发明

一种聚焦样本特征间距的全生命周期语音情感识别方法

2023-08-31 07:28:27 发布于四川 1

申请专利号：CN202310794609.X
公开（公告）日：2025-07-15
公开（公告）号：CN116645980A
申请人：南开大学

摘要：本发明涉及计算机处理技术领域，更具体地，涉及一种聚焦样本特征间距的全生命周期语音情感识别方法。在预训练阶段，本发明引入大规模预训练模型提取更为准确的语音表征；在微调阶段，通过交叉熵损失和有监督对比学习损失加权求和的结果，指导模型进行微调，使模型学习到的样本表征间距获得改善；在推理阶段，首先构造数据存储集合，用来存储训练集和验证集的样本表征及样本标签，为进一步利用改善后的样本间距，通过K最近邻检索增强的方法，检索得到数据存储集合中与测试样本最相似的K个样本，将检索得到的标签分布与模型对于测试样本的推理分布结果进行加权求和，得到测试样本的最终预测标签。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116645980 A (43)申请公布日 2023.08.25 (21)申请号 202310794609.X (22)申请日 2023.06.30 (71)申请人南开大学地址 300000 天津市南开区卫津路94号 (72)发明人秦勇　王雪琛　赵石顽　王卉　周家名　贺佳贝　 (74)专利代理机构合肥晨创知识产权代理事务所(普通合伙) 34162 专利代理师康培培 (51)Int.Cl. G10L 25/63 (2013.01) G10L 25/27 (2013.01) G10L 25/03 (2013.01) 权利要求书2页说明书6页附图1页 (54)发明名称一种聚焦样本特征间距的全生命周期语音情感识别方法 (57)摘要本发明涉及计算机处理技术领域，更具体地，涉及一种聚焦样本特征间距的全生命周期语音情感识别方法。在预训练阶段，本发明引入大规模预训练模型提取更为准确的语音表征；在微调阶段，通过交叉熵损失和有监督对比学习损失加权求和的结果，指导模型进行微调，使模型学习到的样本表征间距获得改善；在推理阶段，首先构造数据存储集合，用来存储训练集和验证集的样本表征及样本标签，为进一步利用改善后的样本间距，通过K最近邻检索增强的方法，检索得到数据存储集合中与测试样本最相似的K个样 A 本，将检索得到的标签分布与模型对于测试样本 0 的推理分布结果进行加权

一种聚焦样本特征间距的全生命周期语音情感识别方法

专利内容

最新专利

相关专利