发明

语音处理方法、装置、设备及存储介质

2023-06-05 18:26:14 发布于四川 0
  • 申请专利号:CN202011634031.4
  • 公开(公告)日:2024-04-16
  • 公开(公告)号:CN112735392A
  • 申请人:中国科学技术大学|||科大讯飞股份有限公司
摘要:本申请实施例公开了一种语音处理方法、装置、设备及存储介质,通过对用于解码文本单元的权重序列进行改进,使得每一文本单元对应的权重序列与各语音帧的时间信息的关联关系趋近于目标函数关系,由于每一文本单元对应的目标函数关系表示,该文本单元与各个语音帧的时间信息的关联度,与各个语音帧的时间信息间的关联关系,这就使得,利用权重序列进行解码得到的文本单元与语音帧的时间信息是强相关的,因此,利用各个语音帧的时间信息,以及各文本单元对应的目标函数能够准确实现语音帧的时间信息与文本单元的对应关系,也就是将语音帧的时间信息与文本单元准确对齐,从而提高了将语音识别结果与音频对齐的准确率。

专利内容

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112735392 A (43)申请公布日 2021.04.30 (21)申请号 202011634031.4 (22)申请日 2020.12.31 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新区望江西 路666号 (72)发明人 吴明辉 方昕 刘俊华  (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 张静 (51)Int.Cl. G10L 15/14 (2006.01) G10L 15/26 (2006.01) G10L 19/00 (2013.01) G10L 25/51 (2013.01) 权利要求书3页 说明书15页 附图4页 (54)发明名称 语音处理方法、装置、设备及存储介质 (57)摘要 本申请实施例公开了一种语音处理方法、装 置、设备及存储介质,通过对用于解码文本单元 的权重序列进行改进,使得每一文本单元对应的 权重序列与各语音帧的时间信息的关联关系趋 近于目标函数关系,由于每一文本单元对应的目 标函数关系表示,该文本单元与各个语音帧的时 间信息的关联度,与各个语音帧的时间信息间的 关联关系,这就使得,利用权重序列进行解码得 到的文本单元与语音帧的时间信息是强相关的, 因此,利用各个语音帧的时间信息,以及各文本 单元对应的目标函数能够准确实现语音帧的时 间信息与文本单元的对应关系,也就是将语音帧 A 的时间信

最新专利