发明

语音识别方法、装置、电子设备及存储介质2024

2024-03-29 07:21:51 发布于四川 0

申请专利号：CN202311672423.3
公开（公告）日：2024-03-26
公开（公告）号：CN117765927A
申请人：OPPO广东移动通信有限公司

摘要：本申请提供一种语音识别方法、装置、电子设备及存储介质，所述方法包括利用目标语音识别模型确定第一帧语音的声学嵌入向量；利用目标语音识别模型确定第一帧语音对应的文本嵌入向量；获取第一帧语音的语种嵌入向量；根据声学嵌入向量、文本嵌入向量和语种嵌入向量，确定第一帧语音对应的第一文本信息。本申请提供的语音识别方法在语音识别时，结合语音对应的语种嵌入向量，在识别过程中考虑到语种的相关信息从而更加准确的识别出对应的文本信息，提高语音识别的精度；同时还可以利用同一个语音识别模型识别不同的语种，增加语音识别模型的适用场景。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117765927 A (43)申请公布日 2024.03.26 (21)申请号 202311672423.3 G10L 15/26 (2006.01) (22)申请日 2023.12.06 (71)申请人 OPPO广东移动通信有限公司地址 523860 广东省东莞市长安镇乌沙海滨路18号 (72)发明人郭一凡　刘亚明　田垚　单煜翔　索宏彬　万玉龙　 (74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙) 44300 专利代理师李玉婷 (51)Int.Cl. G10L 15/00 (2013.01) G10L 15/02 (2006.01) G10L 15/06 (2013.01) G10L 15/16 (2006.01) 权利要求书2页说明书14页附图6页 (54)发明名称语音识别方法、装置、电子设备及存储介质 (57)摘要本申请提供一种语音识别方法、装置、电子设备及存储介质，所述方法包括利用目标语音识别模型确定第一帧语音的声学嵌入向量；利用目标语音识别模型确定第一帧语音对应的文本嵌入向量；获取第一帧语音的语种嵌入向量；根据声学嵌入向量、文本嵌入向量和语种嵌入向量，确定第一帧语音对应的第一文本信息。本申请提供的语音识别方法在语音识别时，结合语音对应的语种嵌入向量，在识别过

语音识别方法、装置、电子设备及存储介质2024

专利内容

最新专利

相关专利