发明

一种显示设备及语音识别方法2024

2024-04-04 07:17:45 发布于四川 0
  • 申请专利号:CN202311477375.2
  • 公开(公告)日:2024-04-02
  • 公开(公告)号:CN117809653A
  • 申请人:海信电子科技(武汉)有限公司
摘要:本申请提供一种显示设备及语音识别方法,方法包括:获取声学训练语料;基于发音词典和声学文本信息构建声学训练语料的候选音节序列;根据候选音节序列中音节出现的时间戳和候选音节序列的置信度从候选音节序列中确定出目标音节序列;通过音频和目标音节序列生成声学模型;获取文本训练语料以及将文本训练语料输入至混合语音识别模型中的语言模型中,以得到概率统计文件;将概率统计文件转换为解码搜索图;获取用户输入的待识别语音,并将待识别语音输入到声学模型和解码搜索图,以及输出对待识别语音的语音识别结果。所述方法通过结合端到端语音识别方法以及解码搜索图综合确定待识别语音对应的语音识别结果,可以提升语音识别结果的准确率。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117809653 A (43)申请公布日 2024.04.02 (21)申请号 202311477375.2 (22)申请日 2023.11.03 (71)申请人 海信电子科技(武汉)有限公司 地址 430019 湖北省武汉市武汉东湖新技 术开发区高新六路99号南山光谷自贸 港B栋4层1-4号房(自贸区武汉片区) (72)发明人 张晓明 穆聪聪  (74)专利代理机构 北京弘权知识产权代理有限 公司 11363 专利代理师 逯长明 占园 (51)Int.Cl. G10L 15/26 (2006.01) G10L 15/06 (2013.01) G10L 15/183 (2013.01) G10L 15/16 (2006.01) 权利要求书3页 说明书14页 附图12页 (54)发明名称 一种显示设备及语音识别方法 (57)摘要 本申请提供一种显示设备及语音识别方法, 方法包括:获取声学训练语料;基于发音词典和 声学文本信息构建声学训练语料的候选音节序 列;根据候选音节序列中音节出现的时间戳和候 选音节序列的置信度从候选音节序列中确定出 目标音节序列;通过音频和目标音节序列生成声 学模型;获取文本训练语料以及将文本训练语料 输入至混合语音识别模型中的语言模型中,以得 到概率统计文件;将概率统计文件转换为解码搜 索图;获取用户输入的待识别语音,并将待识别

最新专利