发明

一种语音识别方法、装置和计算机设备

2023-07-06 10:55:48 发布于四川 0
  • 申请专利号:CN202110815555.1
  • 公开(公告)日:2025-06-24
  • 公开(公告)号:CN113823265A
  • 申请人:腾讯科技(深圳)有限公司
摘要:本申请实施例公开了一种语音识别方法、装置和计算机设备;本申请实施例可以获取目标语言下语音数据的至少一个语音特征帧;分别对至少一个语音特征帧进行音素对齐,得到语音数据在目标语言中的目标音素集合;分别对至少一个语音特征帧进行词单元对齐,得到语音数据在目标语言中的目标词集合,其中,目标词集合包括每个语音特征帧对应的词单元;分别对至少一个语音特征帧进行文本映射,得到语音数据在目标语言中的初始语音识别文本;根据目标音素集合和目标词集合,对初始语音识别文本进行调整,得到并输出语音数据的语音识别文本,从而提高语音识别的准确率。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113823265 A (43)申请公布日 2021.12.21 (21)申请号 202110815555.1 (22)申请日 2021.07.19 (71)申请人 腾讯科技(深圳)有限公司 地址 518057 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 胡鹏飞 麻国栋 黄申  (74)专利代理机构 深圳翼盛智成知识产权事务 所(普通合伙) 44300 代理人 李汉亮 (51)Int.Cl. G10L 15/02 (2006.01) G10L 15/26 (2006.01) 权利要求书3页 说明书19页 附图9页 (54)发明名称 一种语音识别方法、装置和计算机设备 (57)摘要 本申请实施例公开了一种语音识别方法、装 置和计算机设备;本申请实施例可以获取目标语 言下语音数据的至少一个语音特征帧;分别对至 少一个语音特征帧进行音素对齐,得到语音数据 在目标语言中的目标音素集合;分别对至少一个 语音特征帧进行词单元对齐,得到语音数据在目 标语言中的目标词集合,其中,目标词集合包括 每个语音特征帧对应的词单元;分别对至少一个 语音特征帧进行文本映射,得到语音数据在目标 语言中的初始语音识别文本;根据目标音素集合 和目标词集合,对初始语音识别文本进行调整, 得到并输出语音数据的语音识别文本,从而提高 A 语音识别的准确率。 5 6 2 3 2 8 3 1 1 N

最新专利