发明

语音识别模型训练方法、语音识别方法、装置及存储介质

2023-05-18 13:03:14 发布于四川 0
  • 申请专利号:CN202210445742.X
  • 公开(公告)日:2024-11-12
  • 公开(公告)号:CN114863916A
  • 申请人:北京小米移动软件有限公司|||北京小米松果电子有限公司
摘要:本公开是关于一种语音识别模型训练方法、语音识别方法、装置及存储介质。其中,语音识别模型训练方法包括:获取多通道语音样本集,将所述多通道语音样本集输入到第一深度残差网络编码器中,得到第一样本特征集,对所述多通道语音样本集进行转换处理,得到单通道语音样本集,将所述单通道语音样本集输入到第二深度残差网络编码器中,得到第二样本特征集;从所述第一样本特征集和所述第二样本特征集中选择目标样本特征集;将所述目标样本特征集输入至预设的递归神经网络模型,对所述递归神经网络模型进行训练直至收敛,得到语音识别模型。通过本公开的语音识别模型训练方法进行语音识别,能够提高语音识别性能。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114863916 A (43)申请公布日 2022.08.05 (21)申请号 202210445742.X G10L 25/30 (2013.01) (22)申请日 2022.04.26 (71)申请人 北京小米移动软件有限公司 地址 100085 北京市海淀区西二旗中路33 号院6号楼8层018号 申请人 北京小米松果电子有限公司 (72)发明人 王全东 梁玉权 高鹏 庄伟基  (74)专利代理机构 北京钲霖知识产权代理有限 公司 11722 专利代理师 李志新 杨继成 (51)Int.Cl. G10L 15/06 (2013.01) G10L 15/02 (2006.01) G10L 15/18 (2013.01) G10L 15/26 (2006.01) 权利要求书4页 说明书16页 附图8页 (54)发明名称 语音识别模型训练方法、语音识别方法、装 置及存储介质 (57)摘要 本公开是关于一种语音识别模型训练方法、 语音识别方法、装置及存储介质。其中,语音识别 模型训练方法包括:获取多通道语音样本集,将 所述多通道语音样本集输入到第一深度残差网 络编码器中,得到第一样本特征集,对所述多通 道语音样本集进行转换处理,得到单通道语音样 本集,将所述单通道语音样本集输入到第二深度 残差网络编码器中,得到第二样本特征集;从所

最新专利