一种声纹特征提取方法、装置、设备及存储介质
- 申请专利号:CN202310362146.X
- 公开(公告)日:2025-06-27
- 公开(公告)号:CN116312563A
- 申请人:科大讯飞股份有限公司
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116312563 A (43)申请公布日 2023.06.23 (21)申请号 202310362146.X (22)申请日 2023.04.03 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新区望江西 路666号 (72)发明人 李晋 高天 方昕 刘聪 徐文渊 陈艳姣 (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 专利代理师 陈颖 (51)Int.Cl. G10L 17/04 (2013.01) G10L 17/02 (2013.01) G10L 17/20 (2013.01) 权利要求书3页 说明书14页 附图6页 (54)发明名称 一种声纹特征提取方法、装置、设备及存储 介质 (57)摘要 本发明提供了一种声纹特征提取方法、装 置、设备及存储介质,方法包括:获取目标语音数 据的若干语谱片段;基于预先训练得到的声纹提 取模型对若干语谱片段分别提取声纹特征 ,其 中,声纹提取模型以若干时序未打乱的训练语谱 片段和若干时序打乱的训练语谱片段为训练样 本,以训练样本包含的各训练语谱片段分别对应 的真实身份标签为样本标签,以使基于声纹提取 模型对训练样本包含的每个训练语谱片段提取 的声纹特征预测的身份标签与对应的真实身份 标签趋于一致为目标训练得到;基于目标语音数 A 据的若干语谱片段分别对应的声纹特征确定目 3 标语
最新专利
- 吸声装置及吸声系统公开日期:2025-08-12公开号:CN117012175A申请号:CN202210466348.4吸声装置及吸声系统
- 发布时间:2023-11-11 07:14:170
- 申请号:CN202210466348.4
- 公开号:CN117012175A
- 一种基于声纹识别的音频鉴伪方法公开日期:2025-08-12公开号:CN116959455A申请号:CN202310875841.6一种基于声纹识别的音频鉴伪方法
- 发布时间:2023-10-31 07:22:260
- 申请号:CN202310875841.6
- 公开号:CN116959455A
- 一种信息化合成语音的识别方法公开日期:2025-08-12公开号:CN116805485A申请号:CN202310835802.3一种信息化合成语音的识别方法
- 发布时间:2023-09-29 07:10:160
- 申请号:CN202310835802.3
- 公开号:CN116805485A
- 一种基于深度学习的全景音频编码方法公开日期:2025-08-12公开号:CN116453527A申请号:CN202310424297.3一种基于深度学习的全景音频编码方法
- 发布时间:2023-07-21 07:14:460
- 申请号:CN202310424297.3
- 公开号:CN116453527A
- 声纹识别模型训练方法、声纹识别方法及相关设备公开日期:2025-08-12公开号:CN113870862A申请号:CN202111142575.3声纹识别模型训练方法、声纹识别方法及相关设备
- 发布时间:2023-07-09 07:08:190
- 申请号:CN202111142575.3
- 公开号:CN113870862A
- 音频合成方法和装置、存储介质及电子设备公开日期:2025-08-12公开号:CN113763922A申请号:CN202110517152.9音频合成方法和装置、存储介质及电子设备
- 发布时间:2023-07-03 11:01:180
- 申请号:CN202110517152.9
- 公开号:CN113763922A