发明

语音识别方法、装置、计算机设备和存储介质

2023-05-20 11:02:28 发布于四川 0
  • 申请专利号:CN202210446103.5
  • 公开(公告)日:2024-10-29
  • 公开(公告)号:CN114913848A
  • 申请人:北京绝影智联科技有限公司
摘要:本公开提供了一种语音识别方法、装置、计算机设备和存储介质,其中,该方法包括:基于待识别的语音序列中的语音特征的数量,确定所述语音序列对应的查询矩阵中的每个初始查询特征的第一余弦权重,和语音序列对应的键矩阵中的每个所述初始键特征的第二余弦权重;基于第一余弦权重和第二余弦权重,确定每个初始查询特征分别与各个初始键特征之间的相似度;针对语音序列中的每个语音特征,基于语音特征对应的初始查询特征与各个初始键特征之间的相似度、以及语音序列对应的值矩阵中的每个目标值特征,确定语音特征对应的注意力特征;基于语音序列中各个语音特征分别对应的注意力特征,确定语音序列对应的语音识别结果。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114913848 A (43)申请公布日 2022.08.16 (21)申请号 202210446103.5 (22)申请日 2022.04.26 (71)申请人 北京市商汤科技开发有限公司 地址 100080 北京市海淀区北四环西路58 号11层1101-1117室 (72)发明人 孙景余 李宝祥 钟贵平 周鼎皓  (74)专利代理机构 北京中知恒瑞知识产权代理 事务所(普通合伙) 11889 专利代理师 袁忠林 (51)Int.Cl. G10L 15/10 (2006.01) G10L 15/16 (2006.01) 权利要求书4页 说明书28页 附图5页 (54)发明名称 语音识别方法、装置、计算机设备和存储介 质 (57)摘要 本公开提供了一种语音识别方法、装置、计 算机设备和存储介质,其中,该方法包括:基于待 识别的语音序列中的语音特征的数量,确定所述 语音序列对应的查询矩阵中的每个初始查询特 征的第一余弦权重,和语音序列对应的键矩阵中 的每个所述初始键特征的第二余弦权重;基于第 一余弦权重和第二余弦权重,确定每个初始查询 特征分别与各个初始键特征之间的相似度;针对 语音序列中的每个语音特征,基于语音特征对应 的初始查询特征与各个初始键特征之间的相似 度、以及语音序列对应的值矩阵中的每个目标值 A 特征,确定语音特征对应的注意力特征;基于语 8 音序列中各个语音特征分别对应的注意力特征, 4 8 3

最新专利