发明

一种语音识别方法

2023-07-09 07:13:10 发布于四川 1
  • 申请专利号:CN202310064142.3
  • 公开(公告)日:2025-11-04
  • 公开(公告)号:CN116403573A
  • 申请人:湖北星纪魅族科技有限公司
摘要:本申请提供一种语音识别方法,该方法包括:获取待识别音频的特征数据;将所述特征数据输入到声学模型中,得到所述特征数据对应的时序标签矩阵;通过第一语言模型对所述时序标签矩阵进行解码,得到多个解码路径及其对应的概率得分,将概率得分前N的解码路径确定为N个第一解码结果,其中,N为正整数;基于所述N个第一解码结果、上一轮语音交互领域和当前场景领域确定对应的目标意图领域;基于所述目标意图领域确定相对应的第二语言模型,通过所述第二语言模型,对所述概率得分前N的解码路径重新计算概率值,生成第二解码结果;基于所述第二解码结果确定所述待识别音频的语音识别结果。本申请在保证语音识别准确率的前提下也提高了识别效率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116403573 A (43)申请公布日 2023.07.07 (21)申请号 202310064142.3 (22)申请日 2023.01.11 (71)申请人 湖北星纪魅族科技有限公司 地址 430058 湖北省武汉市经济技术开发 区神龙大道18号太子湖文化数字创意 产业园创谷启动区B1337号 (72)发明人 李林峰 牛坤 黄海荣  (74)专利代理机构 北京路浩知识产权代理有限 公司 11002 专利代理师 董娜 (51)Int.Cl. G10L 15/183 (2013.01) G10L 15/02 (2006.01) G10L 15/06 (2013.01) G10L 19/008 (2013.01) 权利要求书2页 说明书16页 附图5页 (54)发明名称 一种语音识别方法 (57)摘要 本申请提供一种语音识别方法 ,该方法包 括:获取待识别音频的特征数据;将所述特征数 据输入到声学模型中,得到所述特征数据对应的 时序标签矩阵;通过第一语言模型对所述时序标 签矩阵进行解码,得到多个解码路径及其对应的 概率得分,将概率得分前N的解码路径确定为N个 第一解码结果,其中,N为正整数 ;基于所述N个第 一解码结果、上一轮语音交互领域和当前场景领 域确定对应的目标意图领域;基于所述目标意图 领域确定相对应的第二语言模型,通过所述第二 语言模型,对

最新专利