发明

语音识别方法、装置、电子设备及存储介质2024

2024-03-29 07:21:51 发布于四川 0
  • 申请专利号:CN202311672423.3
  • 公开(公告)日:2024-03-26
  • 公开(公告)号:CN117765927A
  • 申请人:OPPO广东移动通信有限公司
摘要:本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括利用目标语音识别模型确定第一帧语音的声学嵌入向量;利用目标语音识别模型确定第一帧语音对应的文本嵌入向量;获取第一帧语音的语种嵌入向量;根据声学嵌入向量、文本嵌入向量和语种嵌入向量,确定第一帧语音对应的第一文本信息。本申请提供的语音识别方法在语音识别时,结合语音对应的语种嵌入向量,在识别过程中考虑到语种的相关信息从而更加准确的识别出对应的文本信息,提高语音识别的精度;同时还可以利用同一个语音识别模型识别不同的语种,增加语音识别模型的适用场景。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117765927 A (43)申请公布日 2024.03.26 (21)申请号 202311672423.3 G10L 15/26 (2006.01) (22)申请日 2023.12.06 (71)申请人 OPPO广东移动通信有限公司 地址 523860 广东省东莞市长安镇乌沙海 滨路18号 (72)发明人 郭一凡 刘亚明 田垚 单煜翔  索宏彬 万玉龙  (74)专利代理机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 专利代理师 李玉婷 (51)Int.Cl. G10L 15/00 (2013.01) G10L 15/02 (2006.01) G10L 15/06 (2013.01) G10L 15/16 (2006.01) 权利要求书2页 说明书14页 附图6页 (54)发明名称 语音识别方法、装置、电子设备及存储介质 (57)摘要 本申请提供一种语音识别方法、装置、电子 设备及存储介质,所述方法包括利用目标语音识 别模型确定第一帧语音的声学嵌入向量;利用目 标语音识别模型确定第一帧语音对应的文本嵌 入向量;获取第一帧语音的语种嵌入向量;根据 声学嵌入向量、文本嵌入向量和语种嵌入向量, 确定第一帧语音对应的第一文本信息。本申请提 供的语音识别方法在语音识别时,结合语音对应 的语种嵌入向量,在识别过

最新专利