发明

一种音频识别方法、装置、电子设备及存储介质

2023-05-12 11:40:53 发布于四川 0
  • 申请专利号:CN202210343564.X
  • 公开(公告)日:2024-09-17
  • 公开(公告)号:CN114550731A
  • 申请人:北京百度网讯科技有限公司
摘要:本公开提供了一种音频识别方法、装置、电子设备、可读存储介质以及计算机程序产品,涉及人工智能、安全认证技术以及声纹识别技术领域。具体实现方案为:基于待识别音频在频域对应的第一音频特征,确定所述待识别音频在实数域对应的第二音频特征;利用目标压缩函数对所述第二音频特征进行特征压缩,获得所述待识别音频对应的非线性音频特征,所述目标压缩函数为预先对可平滑对数压缩函数进行参数学习得到的,所述可平滑对数压缩函数中包括预设的可学习参数;基于所述非线性音频特征,确定所述待识别音频对应的音频识别结果。该方案能够在无需人工提取音频特征的情况下,高效的模拟出待识别音频的非线性,进而能够提高音频识别的安全性和识别效率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114550731 A (43)申请公布日 2022.05.27 (21)申请号 202210343564.X G10L 17/20 (2013.01) (22)申请日 2022.03.31 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张银辉 赵情恩 熊新雷 陈蓉  梁芸铭 周羊  (74)专利代理机构 北京市铸成律师事务所 11313 专利代理师 曹远 付林海 (51)Int.Cl. G10L 17/22 (2013.01) G10L 17/02 (2013.01) G10L 17/04 (2013.01) G10L 17/18 (2013.01) 权利要求书2页 说明书9页 附图3页 (54)发明名称 一种音频识别方法、装置、电子设备及存储 介质 (57)摘要 本公开提供了一种音频识别方法、装置、电 子设备、可读存储介质以及计算机程序产品,涉 及人工智能、安全认证技术以及声纹识别技术领 域。具体实现方案为:基于待识别音频在频域对 应的第一音频特征,确定所述待识别音频在实数 域对应的第二音频特征;利用目标压缩函数对所 述第二音频特征进行特征压缩,获得所述待识别 音频对应的非线性音频特征,所述目标压缩函数 为预先对可平滑对数压缩函数进行参数

最新专利