一种聚焦样本特征间距的全生命周期语音情感识别方法
- 申请专利号:CN202310794609.X
- 公开(公告)日:2025-07-15
- 公开(公告)号:CN116645980A
- 申请人:南开大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116645980 A (43)申请公布日 2023.08.25 (21)申请号 202310794609.X (22)申请日 2023.06.30 (71)申请人 南开大学 地址 300000 天津市南开区卫津路94号 (72)发明人 秦勇 王雪琛 赵石顽 王卉 周家名 贺佳贝 (74)专利代理机构 合肥晨创知识产权代理事务 所(普通合伙) 34162 专利代理师 康培培 (51)Int.Cl. G10L 25/63 (2013.01) G10L 25/27 (2013.01) G10L 25/03 (2013.01) 权利要求书2页 说明书6页 附图1页 (54)发明名称 一种聚焦样本特征间距的全生命周期语音 情感识别方法 (57)摘要 本发明涉及计算机处理技术领域 ,更具体 地,涉及一种聚焦样本特征间距的全生命周期语 音情感识别方法。在预训练阶段,本发明引入大 规模预训练模型提取更为准确的语音表征;在微 调阶段,通过交叉熵损失和有监督对比学习损失 加权求和的结果,指导模型进行微调,使模型学 习到的样本表征间距获得改善;在推理阶段,首 先构造数据存储集合,用来存储训练集和验证集 的样本表征及样本标签,为进一步利用改善后的 样本间距,通过K最近邻检索增强的方法,检索得 到数据存储集合中与测试样本最相似的K个样 A 本,将检索得到的标签分布与模型对于测试样本 0 的推理分布结果进行加权
最新专利
- 一种基于层次化迁移学习的蒙古语自动语音质量评估方法公开日期:2025-07-25公开号:CN116434778A申请号:CN202310145884.9一种基于层次化迁移学习的蒙古语自动语音质量评估方法
- 发布时间:2023-07-16 07:20:450
- 申请号:CN202310145884.9
- 公开号:CN116434778A
- 一种基于多任务学习和子域自适应的跨库语音情感识别方法公开日期:2025-07-25公开号:CN113870900A申请号:CN202111125098.X一种基于多任务学习和子域自适应的跨库语音情感识别方法
- 发布时间:2023-07-09 07:07:450
- 申请号:CN202111125098.X
- 公开号:CN113870900A
- 一种基于沃尔泰拉滤波器的非线性主动噪声控制系统公开日期:2025-07-25公开号:CN116386585A申请号:CN202310386499.3一种基于沃尔泰拉滤波器的非线性主动噪声控制系统
- 发布时间:2023-07-06 10:33:420
- 申请号:CN202310386499.3
- 公开号:CN116386585A
- 风噪抑制方法、装置、设备及计算机可读存储介质公开日期:2025-07-25公开号:CN116386654A申请号:CN202310180377.9风噪抑制方法、装置、设备及计算机可读存储介质
- 发布时间:2023-07-06 10:28:320
- 申请号:CN202310180377.9
- 公开号:CN116386654A
- 一种基于JDC-CRNN的鸟声检测方法与系统公开日期:2025-07-25公开号:CN116246640A申请号:CN202310084987.9一种基于JDC-CRNN的鸟声检测方法与系统
- 发布时间:2023-06-11 13:12:020
- 申请号:CN202310084987.9
- 公开号:CN116246640A
- 合唱处理的方法、服务器、终端、系统和存储介质公开日期:2025-07-25公开号:CN116206584A申请号:CN202310270230.9合唱处理的方法、服务器、终端、系统和存储介质
- 发布时间:2023-06-04 11:16:320
- 申请号:CN202310270230.9
- 公开号:CN116206584A