发明

一种声纹特征提取方法、装置、设备及存储介质

2023-06-27 09:50:56 发布于四川 2

申请专利号：CN202310362146.X
公开（公告）日：2025-06-27
公开（公告）号：CN116312563A
申请人：科大讯飞股份有限公司

摘要：本发明提供了一种声纹特征提取方法、装置、设备及存储介质，方法包括：获取目标语音数据的若干语谱片段；基于预先训练得到的声纹提取模型对若干语谱片段分别提取声纹特征，其中，声纹提取模型以若干时序未打乱的训练语谱片段和若干时序打乱的训练语谱片段为训练样本，以训练样本包含的各训练语谱片段分别对应的真实身份标签为样本标签，以使基于声纹提取模型对训练样本包含的每个训练语谱片段提取的声纹特征预测的身份标签与对应的真实身份标签趋于一致为目标训练得到；基于目标语音数据的若干语谱片段分别对应的声纹特征确定目标语音数据对应的声纹特征。本发明提供的声纹特征提取方法不易受语音时序的影响，可提取到较为精准鲁棒的声纹特征。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116312563 A (43)申请公布日 2023.06.23 (21)申请号 202310362146.X (22)申请日 2023.04.03 (71)申请人科大讯飞股份有限公司地址 230088 安徽省合肥市高新区望江西路666号 (72)发明人李晋　高天　方昕　刘聪　徐文渊　陈艳姣　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师陈颖 (51)Int.Cl. G10L 17/04 (2013.01) G10L 17/02 (2013.01) G10L 17/20 (2013.01) 权利要求书3页说明书14页附图6页 (54)发明名称一种声纹特征提取方法、装置、设备及存储介质 (57)摘要本发明提供了一种声纹特征提取方法、装置、设备及存储介质，方法包括：获取目标语音数据的若干语谱片段；基于预先训练得到的声纹提取模型对若干语谱片段分别提取声纹特征，其中，声纹提取模型以若干时序未打乱的训练语谱片段和若干时序打乱的训练语谱片段为训练样本，以训练样本包含的各训练语谱片段分别对应的真实身份标签为样本标签，以使基于声纹提取模型对训练样本包含的每个训练语谱片段提取的声纹特征预测的身份标签与对应的真实身份标签趋于一致为目标训练得到；基于目标语音数 A 据的若干语谱片段分别对应的声纹特征确定目 3 标语

一种声纹特征提取方法、装置、设备及存储介质

专利内容

最新专利

相关专利