发明

语音识别方法、装置、计算机可读存储介质及计算机设备

2023-07-06 10:55:41 发布于四川 0

申请专利号：CN202110731479.6
公开（公告）日：2025-06-24
公开（公告）号：CN113823264A
申请人：腾讯科技（深圳）有限公司

摘要：本发明实施例公开了一种语音识别方法、装置、计算机可读存储介质及计算机设备，方法通过对待识别的语音信息进行特征提取，得到多个特征向量；计算每个特征向量的稀疏度值，稀疏度值为每个特征向量的自注意力得分序列的分布与自注意力得分序列的均匀分布之间的相对熵；确定稀疏度值大于预设阈值的第一特征向量以及稀疏度值不大于预设阈值的第二特征向量；根据第一特征向量的自注意力计算结果与第二特征向量确定目标矩阵；将目标矩阵与标签序列对应的特征矩阵输入至分类网络进行分类处理，得到对待识别的语音信息对应的识别结果。以此，本申请采用深度学习方法，降低了语音识别过程中自注意力机制的计算量，从而提升了语音识别的效率。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113823264 A (43)申请公布日 2021.12.21 (21)申请号 202110731479.6 (22)申请日 2021.06.30 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层 (72)发明人孙思宁　 (74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙) 44300 代理人李汉亮 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/08 (2006.01) 权利要求书3页说明书17页附图6页 (54)发明名称语音识别方法、装置、计算机可读存储介质及计算机设备 (57)摘要本发明实施例公开了一种语音识别方法、装置、计算机可读存储介质及计算机设备，方法通过对待识别的语音信息进行特征提取，得到多个特征向量；计算每个特征向量的稀疏度值，稀疏度值为每个特征向量的自注意力得分序列的分布与自注意力得分序列的均匀分布之间的相对熵；确定稀疏度值大于预设阈值的第一特征向量以及稀疏度值不大于预设阈值的第二特征向量；根据第一特征向量的自注意力计算结果与第二特征向量确定目标矩阵；将目标矩阵与标签序列对应的特征矩阵输入至分类网络进行分类处理， A 得到对待识别的语音信息对应的识别结果。以 4 此，本申请采用深度学习方法，降低了语音识别 6 2 3 过程中自注意力机制

语音识别方法、装置、计算机可读存储介质及计算机设备

专利内容

最新专利

相关专利