语音识别方法、装置、计算机可读存储介质及计算机设备
- 申请专利号:CN202110731479.6
- 公开(公告)日:2025-06-24
- 公开(公告)号:CN113823264A
- 申请人:腾讯科技(深圳)有限公司
专利内容
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113823264 A (43)申请公布日 2021.12.21 (21)申请号 202110731479.6 (22)申请日 2021.06.30 (71)申请人 腾讯科技(深圳)有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 孙思宁 (74)专利代理机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 代理人 李汉亮 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/08 (2006.01) 权利要求书3页 说明书17页 附图6页 (54)发明名称 语音识别方法、装置、计算机可读存储介质 及计算机设备 (57)摘要 本发明实施例公开了一种语音识别方法、装 置、计算机可读存储介质及计算机设备,方法通 过对待识别的语音信息进行特征提取,得到多个 特征向量;计算每个特征向量的稀疏度值,稀疏 度值为每个特征向量的自注意力得分序列的分 布与自注意力得分序列的均匀分布之间的相对 熵;确定稀疏度值大于预设阈值的第一特征向量 以及稀疏度值不大于预设阈值的第二特征向量; 根据第一特征向量的自注意力计算结果与第二 特征向量确定目标矩阵;将目标矩阵与标签序列 对应的特征矩阵输入至分类网络进行分类处理, A 得到对待识别的语音信息对应的识别结果。以 4 此,本申请采用深度学习方法,降低了语音识别 6 2 3 过程中自注意力机制
最新专利
- 吸声装置及吸声系统公开日期:2025-08-12公开号:CN117012175A申请号:CN202210466348.4吸声装置及吸声系统
- 发布时间:2023-11-11 07:14:170
- 申请号:CN202210466348.4
- 公开号:CN117012175A
- 一种基于声纹识别的音频鉴伪方法公开日期:2025-08-12公开号:CN116959455A申请号:CN202310875841.6一种基于声纹识别的音频鉴伪方法
- 发布时间:2023-10-31 07:22:260
- 申请号:CN202310875841.6
- 公开号:CN116959455A
- 一种信息化合成语音的识别方法公开日期:2025-08-12公开号:CN116805485A申请号:CN202310835802.3一种信息化合成语音的识别方法
- 发布时间:2023-09-29 07:10:160
- 申请号:CN202310835802.3
- 公开号:CN116805485A
- 一种基于深度学习的全景音频编码方法公开日期:2025-08-12公开号:CN116453527A申请号:CN202310424297.3一种基于深度学习的全景音频编码方法
- 发布时间:2023-07-21 07:14:460
- 申请号:CN202310424297.3
- 公开号:CN116453527A
- 声纹识别模型训练方法、声纹识别方法及相关设备公开日期:2025-08-12公开号:CN113870862A申请号:CN202111142575.3声纹识别模型训练方法、声纹识别方法及相关设备
- 发布时间:2023-07-09 07:08:190
- 申请号:CN202111142575.3
- 公开号:CN113870862A
- 音频合成方法和装置、存储介质及电子设备公开日期:2025-08-12公开号:CN113763922A申请号:CN202110517152.9音频合成方法和装置、存储介质及电子设备
- 发布时间:2023-07-03 11:01:180
- 申请号:CN202110517152.9
- 公开号:CN113763922A