发明

音频识别方法、电子设备及计算机可读存储介质

2023-06-27 09:47:55 发布于四川 0
  • 申请专利号:CN202310313241.0
  • 公开(公告)日:2025-05-20
  • 公开(公告)号:CN116312496A
  • 申请人:腾讯音乐娱乐科技(深圳)有限公司
摘要:本申请实施例公开了一种音频识别方法、电子设备及计算机可读存储介质,其中方法包括对目标音频进行切片操作得到多个音频片段,并获取每个音频片段的旋律指纹;针对每个音频片段,在指纹库中查找与旋律指纹相似度最高的前K个预存旋律指纹以及K个预存旋律指纹对应的匹配歌曲,得到音频片段的K个匹配歌曲;基于相邻匹配歌曲之间的预设转移概率以及每个音频片段的K个匹配歌曲对应的相似度,从每个音频片段的K个匹配歌曲中确定每个音频片段的目标匹配歌曲;根据每个音频片段的目标匹配歌曲,确定目标音频的音频识别结果,音频识别结果用于指示目标音频是否为串烧歌曲。本申请可以提升音频识别的准确率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116312496 A (43)申请公布日 2023.06.23 (21)申请号 202310313241.0 (22)申请日 2023.03.27 (71)申请人 腾讯音乐娱乐科技 (深圳)有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 王武城 孔令城 赵伟峰 姜涛  周文江  (74)专利代理机构 广州三环专利商标代理有限 公司 44202 专利代理师 陈梅君 (51)Int.Cl. G10L 15/14 (2006.01) G10L 15/28 (2013.01) G10L 15/04 (2013.01) 权利要求书4页 说明书22页 附图6页 (54)发明名称 音频识别方法、电子设备及计算机可读存储 介质 (57)摘要 本申请实施例公开了一种音频识别方法、电 子设备及计算机可读存储介质,其中方法包括对 目标音频进行切片操作得到多个音频片段,并获 取每个音频片段的旋律指纹 ;针对每个音频片 段,在指纹库中查找与旋律指纹相似度最高的前 K个预存旋律指纹以及K个预存旋律指纹对应的 匹配歌曲,得到音频片段的K个匹配歌曲;基于相 邻匹配歌曲之间的预设转移概率以及每个音频 片段的K个匹配歌曲对应的相似度,从每个音频 片段的K个匹配歌曲中确定每个音频片段的目标 匹配歌曲;根据每个音频片段的目标匹配歌曲 , A 确定目标音频的音频识别

最新专利