发明

语音识别模型训练方法、语音识别方法、装置及存储介质

2023-05-18 13:03:14 发布于四川 0

申请专利号：CN202210445742.X
公开（公告）日：2024-11-12
公开（公告）号：CN114863916A
申请人：北京小米移动软件有限公司|||北京小米松果电子有限公司

摘要：本公开是关于一种语音识别模型训练方法、语音识别方法、装置及存储介质。其中，语音识别模型训练方法包括：获取多通道语音样本集，将所述多通道语音样本集输入到第一深度残差网络编码器中，得到第一样本特征集，对所述多通道语音样本集进行转换处理，得到单通道语音样本集，将所述单通道语音样本集输入到第二深度残差网络编码器中，得到第二样本特征集；从所述第一样本特征集和所述第二样本特征集中选择目标样本特征集；将所述目标样本特征集输入至预设的递归神经网络模型，对所述递归神经网络模型进行训练直至收敛，得到语音识别模型。通过本公开的语音识别模型训练方法进行语音识别，能够提高语音识别性能。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114863916 A (43)申请公布日 2022.08.05 (21)申请号 202210445742.X G10L 25/30 (2013.01) (22)申请日 2022.04.26 (71)申请人北京小米移动软件有限公司地址 100085 北京市海淀区西二旗中路33 号院6号楼8层018号申请人北京小米松果电子有限公司 (72)发明人王全东　梁玉权　高鹏　庄伟基　 (74)专利代理机构北京钲霖知识产权代理有限公司 11722 专利代理师李志新　杨继成 (51)Int.Cl. G10L 15/06 (2013.01) G10L 15/02 (2006.01) G10L 15/18 (2013.01) G10L 15/26 (2006.01) 权利要求书4页说明书16页附图8页 (54)发明名称语音识别模型训练方法、语音识别方法、装置及存储介质 (57)摘要本公开是关于一种语音识别模型训练方法、语音识别方法、装置及存储介质。其中，语音识别模型训练方法包括：获取多通道语音样本集，将所述多通道语音样本集输入到第一深度残差网络编码器中，得到第一样本特征集，对所述多通道语音样本集进行转换处理，得到单通道语音样本集，将所述单通道语音样本集输入到第二深度残差网络编码器中，得到第二样本特征集；从所

语音识别模型训练方法、语音识别方法、装置及存储介质

专利内容

最新专利

相关专利