发明

语音识别方法、装置及电子设备

2023-08-06 07:26:48 发布于四川 1
  • 申请专利号:CN202310659632.8
  • 公开(公告)日:2025-10-31
  • 公开(公告)号:CN116543757A
  • 申请人:阿里巴巴(中国)有限公司
摘要:本申请提供一种语音识别方法、装置及电子设备。该语音识别方法包括:获取待识别语音,待识别语音为多通道音频,且待识别语音为多个声源发出的;获取多个声源的声纹特征,声源和声纹特征一一对应;将待识别语音和声纹特征输入至预先训练的语音识别模型中,基于待识别语音的空间信息和声纹特征,对待识别语音进行识别,得到待识别语音对应的识别文本,识别文本包括:文本片段和文本片段对应声源标识,本申请能够准确的识别出多通道音频对应的文本以及发声源。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116543759 A (43)申请公布日 2023.08.04 (21)申请号 202310713922.6 (22)申请日 2023.06.15 (71)申请人 支付宝(杭州)信息技术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-11 (72)发明人 吕安旗 王志铭 徐陈虹  (74)专利代理机构 北京国昊天诚知识产权代理 有限公司 11315 专利代理师 朱文杰 (51)Int.Cl. G10L 15/08 (2006.01) G10L 15/32 (2013.01) 权利要求书2页 说明书15页 附图6页 (54)发明名称 语音识别处理方法及装置 (57)摘要 本说明书实施例提供了语音识别处理方法 及装置,其中,一种语音识别处理方法包括:将待 识别语音的语音帧进行语音识别获得的多个候 选字符,以及对待识别语音中已识别语音帧的识 别输出的历史字符序构成的字符组合与关键字 符序列进行匹配,根据匹配结果更新各候选字符 的识别概率,并计算各候字符与历史字符序列构 成的候选字符序列的识别指标,根据各候选字符 序列的识别指标筛选出待识别语音中已识别语 音帧的目标字符序列。 A 9 5 7 3 4 5 6 1 1 N C CN 116543759 A 权 利 要 求 书 1

最新专利