语音识别方法、装置、计算机设备和存储介质
- 申请专利号:CN202210446103.5
- 公开(公告)日:2024-10-29
- 公开(公告)号:CN114913848A
- 申请人:北京绝影智联科技有限公司
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114913848 A (43)申请公布日 2022.08.16 (21)申请号 202210446103.5 (22)申请日 2022.04.26 (71)申请人 北京市商汤科技开发有限公司 地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人 孙景余 李宝祥 钟贵平 周鼎皓 (74)专利代理机构 北京中知恒瑞知识产权代理 事务所(普通合伙) 11889 专利代理师 袁忠林 (51)Int.Cl. G10L 15/10 (2006.01) G10L 15/16 (2006.01) 权利要求书4页 说明书28页 附图5页 (54)发明名称 语音识别方法、装置、计算机设备和存储介 质 (57)摘要 本公开提供了一种语音识别方法、装置、计 算机设备和存储介质,其中,该方法包括:基于待 识别的语音序列中的语音特征的数量,确定所述 语音序列对应的查询矩阵中的每个初始查询特 征的第一余弦权重,和语音序列对应的键矩阵中 的每个所述初始键特征的第二余弦权重;基于第 一余弦权重和第二余弦权重,确定每个初始查询 特征分别与各个初始键特征之间的相似度;针对 语音序列中的每个语音特征,基于语音特征对应 的初始查询特征与各个初始键特征之间的相似 度、以及语音序列对应的值矩阵中的每个目标值 A 特征,确定语音特征对应的注意力特征;基于语 8 音序列中各个语音特征分别对应的注意力特征, 4 8 3